Projet Gemma : Remerciements et contributions de l'équipe

2025-09-12
Projet Gemma : Remerciements et contributions de l'équipe

Le succès du projet Gemma est dû aux efforts collaboratifs des équipes Gemma et Google Confidentialité. Merci tout particulièrement à Peter Kairouz, Brendan McMahan et Dan Ramage pour leurs commentaires sur l'article de blog, à Mark Simborg et Kimberly Schwede pour leur aide sur les visualisations, et aux équipes Google qui ont contribué à la conception de l'algorithme, à la mise en œuvre de l'infrastructure et à la maintenance de la production. L'article liste également 20 personnes ayant directement contribué au travail.

Lire plus

Amélioration de l'ajustement fin des LLM grâce à la curation itérative des données

2025-08-08
Amélioration de l'ajustement fin des LLM grâce à la curation itérative des données

Des chercheurs ont considérablement amélioré les performances des grands modèles de langage (LLM) grâce à la curation itérative de leurs données d'entraînement. Les expériences ont impliqué deux LLM de tailles différentes (Gemini Nano-1 et Nano-2) sur des tâches de complexité variable, utilisant environ 100 000 annotations provenant de la foule, initialement affectées par un fort déséquilibre des classes (95% bénignes). Grâce à la curation itérative d'experts et à l'ajustement fin du modèle, les performances ont augmenté de manière significative. Les modèles ont atteint environ 40% d'exemples positifs et un Kappa de Cohen d'environ 0,81 (complexité inférieure) et 0,78 (complexité supérieure), se rapprochant des performances de niveau expert, soulignant le rôle crucial des données de haute qualité dans l'entraînement des LLM.

Lire plus

Alerte sismique précoce : le compromis entre vitesse et précision dans l’estimation de la magnitude

2025-07-23
Alerte sismique précoce : le compromis entre vitesse et précision dans l’estimation de la magnitude

Un défi majeur des systèmes d’alerte sismique précoce (EEW) est l’estimation en temps réel de la magnitude d’un séisme. La magnitude détermine l’ampleur des secousses et les personnes devant être averties. La sous-estimation entraîne des alertes manquées, tandis que la surestimation provoque de fausses alertes et érode la confiance du public. Le défi principal réside dans l’équilibre entre vitesse et précision ; les données initiales sont limitées, mais le retard des alertes réduit le temps d’avertissement. Au cours des trois dernières années, nous avons considérablement amélioré l’estimation de la magnitude, réduisant l’erreur absolue médiane de 0,50 à 0,25. Notre précision rivalise désormais, et dans certains cas surpasse, celle des réseaux sismiques établis.

Lire plus

MUVERA : Recherche Multi-Vecteurs Efficace

2025-06-26
MUVERA : Recherche Multi-Vecteurs Efficace

La recherche d'informations moderne repose sur des modèles d'embedding neuronaux, mais si les modèles multi-vecteurs offrent une précision supérieure, leur complexité de calcul entraîne une inefficacité. Les chercheurs présentent MUVERA, un nouvel algorithme qui transforme la recherche multi-vecteurs complexe en une recherche de produit interne maximal à vecteur unique (MIPS) plus simple grâce à la construction de codages de dimension fixe (FDE). Cela améliore considérablement l'efficacité sans sacrifier la précision. L'implémentation open source est disponible sur GitHub.

Lire plus

Veo Génération 3 : Généralisation de la génération de vidéo

2025-05-16
Veo Génération 3 : Généralisation de la génération de vidéo

La dernière avancée de Google en génération de vidéo, Veo, possède désormais une troisième génération capable de généraliser à diverses tâches. Entraîné sur des millions d'actifs synthétiques 3D de haute qualité, Veo excelle dans la synthèse de nouvelles vues, transformant les images de produits en vidéos 360° cohérentes. Il est important de noter que cette approche se généralise efficacement aux meubles, vêtements, électronique, etc., en capturant avec précision les interactions complexes de lumière et de matière — une amélioration significative par rapport aux générations précédentes.

Lire plus
IA

Google améliore la productivité des développeurs grâce à la complétion de code sémantique hybride ML

2025-05-15
Google améliore la productivité des développeurs grâce à la complétion de code sémantique hybride ML

Des chercheurs de Google ont développé un nouveau système de complétion de code sémantique hybride basé sur Transformer, combinant l'apprentissage automatique (ML) et des moteurs sémantiques basés sur des règles (SE) pour améliorer significativement la productivité des développeurs. Le système intègre ML et SE de trois manières : 1) reclasser les suggestions de jetons uniques de SE à l'aide de ML ; 2) appliquer des complétions de lignes uniques et multiples à l'aide de ML et vérifier l'exactitude avec SE ; et 3) utiliser la continuation de lignes uniques et multiples par ML de suggestions sémantiques de jetons uniques. Une étude de trois mois menée auprès de plus de 10 000 développeurs internes de Google a montré une réduction de 6 % du temps d'itération de codage avec la complétion ML d'une seule ligne. Actuellement, plus de 3 % du nouveau code est généré en acceptant les suggestions de complétion ML. Le système prend en charge huit langages de programmation et intègre des vérifications sémantiques pour garantir l'exactitude du code, augmentant ainsi considérablement la confiance et l'efficacité des développeurs.

Lire plus
Développement

Les embeddings de Whisper s'alignent étonnamment avec l'activité cérébrale humaine pendant la parole

2025-03-26
Les embeddings de Whisper s'alignent étonnamment avec l'activité cérébrale humaine pendant la parole

Une étude révèle un alignement surprenant entre le modèle de reconnaissance vocale Whisper d'OpenAI et l'activité neuronale dans le cerveau humain lors de conversations naturelles. En comparant les embeddings de Whisper à l'activité cérébrale dans des régions comme le gyrus frontal inférieur (IFG) et le gyrus temporal supérieur (STG), les chercheurs ont découvert que les embeddings du langage atteignaient leur pic avant les embeddings de la parole pendant la production de la parole, et vice-versa pendant la compréhension. Cela suggère que Whisper, bien qu'il n'ait pas été conçu en tenant compte des mécanismes cérébraux, capture des aspects clés du traitement du langage. Les résultats mettent également en évidence une « hiérarchie douce » dans le traitement du langage cérébral : les régions d'ordre supérieur comme l'IFG priorisent les informations sémantiques et syntaxiques, mais traitent également les caractéristiques auditives de bas niveau, tandis que les régions d'ordre inférieur comme le STG priorisent le traitement acoustique et phonémique, mais captent également des informations au niveau des mots.

Lire plus

Recherche révolutionnaire : l’équipe derrière le succès

2025-03-03
Recherche révolutionnaire : l’équipe derrière le succès

Cet article est le fruit d’une étroite collaboration avec Asaf Aharoni, Avinatan Hassidim et Danny Vainstein. L’équipe remercie également des dizaines de personnes de Google Research, Google DeepMind et Google Search, notamment YaGuang Li et Blake Hechtman, pour leurs relectures, leurs discussions éclairantes, leurs précieux retours et leur soutien. Leurs contributions ont été cruciales pour l’aboutissement de cette recherche.

Lire plus
IA

Percée de l'IA de Google : Une liste de remerciements révèle un effort d'équipe gigantesque

2025-02-19
Percée de l'IA de Google : Une liste de remerciements révèle un effort d'équipe gigantesque

Les remerciements de cet article révèlent un effort collaboratif massif impliquant de nombreux chercheurs de Google Research, Google DeepMind et Google Cloud AI, ainsi que des collaborateurs de Fleming Initiative, de l'Imperial College London, de l'hôpital méthodiste de Houston, de Sequome et de l'université de Stanford. La longue liste souligne la nature collaborative de la recherche et remercie de nombreux scientifiques ayant fourni des retours techniques et experts, ainsi que de nombreuses équipes internes de Google ayant apporté leur soutien en matière de produits, d'ingénierie et de gestion. La simple longueur des remerciements souligne l'effort d'équipe massif derrière les projets d'IA à grande échelle.

Lire plus

Choc ! Presque toutes les recherches dichotomiques et tris fusion sont cassées

2025-01-11
Choc ! Presque toutes les recherches dichotomiques et tris fusion sont cassées

L'ingénieur logiciel de Google, Joshua Bloch, a révélé un bug vieux de près de deux décennies caché dans les algorithmes de recherche dichotomique, présent à la fois dans le JDK et dans "Perles de Programmation" de Jon Bentley ! Le bug provient de la ligne `int mid = (low + high) / 2;`, provoquant un dépassement de capacité entière et des exceptions d'index de tableau hors limites lorsque la somme de `low` et `high` dépasse la valeur entière positive maximale. Ce bug ne se manifeste qu'avec des ensembles de données massifs, ce qui le rend particulièrement dangereux à l'ère du big data. L'article explore plusieurs solutions et souligne que les bugs peuvent persister même avec des tests et des preuves rigoureux, incitant les programmeurs à rester prudents et humbles.

Lire plus

Google étend l'évaluation du potentiel solaire mondial grâce aux images satellite et à l'apprentissage automatique

2024-12-19
Google étend l'évaluation du potentiel solaire mondial grâce aux images satellite et à l'apprentissage automatique

Des chercheurs de Google ont étendu la couverture de l'API solaire de Google Maps Platform dans le Sud Global en appliquant des modèles d'apprentissage automatique à des images satellite pour générer des modèles numériques de surface haute résolution et des cartes de segmentation de toiture. Cette innovation surmonte les limites des méthodes traditionnelles d'acquisition et de traitement de données, fournissant des données d'évaluation du potentiel solaire pour 1,25 milliard de bâtiments dans le monde et accélérant l'adoption des énergies renouvelables à l'échelle mondiale. Le projet exploite les données satellitaires pour augmenter la fréquence de mise à jour des données et réduire les coûts, ce qui est particulièrement bénéfique dans les régions où les données sont rares.

Lire plus