Category: IA

Le Modèle Est le Produit : La Prochaine Frontière des Investissements en IA

2025-03-18

De nombreuses spéculations circulent sur la prochaine vague de l'IA. L'auteur affirme que la réponse est claire : le modèle lui-même est le produit. La mise à l'échelle généraliste ralentit, l'entraînement spécialisé surpasse les attentes et les coûts d'inférence chutent. Cela oblige les fournisseurs de modèles à monter dans la chaîne de valeur, tandis que les couches d'applications sont confrontées à l'automatisation et aux perturbations. DeepResearch d'OpenAI et Claude 3.7 d'Anthropic en sont des exemples : pas seulement des LLM ou des chatbots, mais des modèles conçus pour des tâches spécifiques. Cela signale une nouvelle phase de l'IA : les entraîneurs de modèles dominent, les développeurs d'applications risquent d'être supplantés. Les investissements dans les couches d'applications pourraient échouer, car l'entraînement des modèles représente la véritable valeur. Le succès futur de l'IA réside dans les entreprises capables d'entraîner des modèles, disposant d'équipes multidisciplinaires et d'un fort engagement.

Query Tables de Dust : donner aux agents IA les moyens d'analyser les données structurées

2025-03-18
Query Tables de Dust : donner aux agents IA les moyens d'analyser les données structurées

Dust a créé Query Tables, un puissant outil pour agents IA permettant d'exécuter des requêtes SQL sur des données structurées. Débutant par la prise en charge des fichiers CSV, il a évolué pour inclure les bases de données Notion, les feuilles de calcul Google et les feuilles de calcul Office 365, aboutissant à des connexions avec des entrepôts de données d'entreprise comme Snowflake et BigQuery. Une couche d'abstraction unifiée permet aux utilisateurs d'interroger diverses sources de données en utilisant la même interface SQL, et même de combiner des données de sources différentes pour l'analyse. Les projets futurs incluent l'intégration de Salesforce pour étendre encore ses capacités d'analyse de données.

Le modèle open source OLMo-2 surpasse GPT-3.5 ? Configuration facile pour Mac !

2025-03-18
Le modèle open source OLMo-2 surpasse GPT-3.5 ? Configuration facile pour Mac !

Le modèle de langage open source OLMo-2, avec 32 milliards de paramètres, prétend surpasser GPT-3.5-Turbo et GPT-4 mini. Toutes les données, le code, les poids et les détails sont librement disponibles. Cet article détaille une configuration simple pour l'exécuter sur un Mac à l'aide du plugin llm-mlx. Téléchargez le modèle de 17 Go avec quelques commandes et engagez-vous dans une conversation interactive ou générez des images ; l'exemple montre la génération d'un SVG d'un pélican à vélo.

IA

Algorithme quantique DQI : une percée en matière d’optimisation ?

2025-03-17
Algorithme quantique DQI : une percée en matière d’optimisation ?

L’équipe de Google Quantum AI a développé un nouvel algorithme quantique appelé Interférométrie quantique décodée (DQI) qui surpasse tous les algorithmes classiques connus pour la résolution d’une large classe de problèmes d’optimisation. L’algorithme n’a pas été conçu pour un problème spécifique, mais plutôt en traduisant le problème en ondes quantiques et en appliquant des techniques de décodage pour trouver la meilleure solution. Bien qu’il manque de matériel quantique suffisant pour les tests empiriques et qu’il existe la possibilité de futurs algorithmes classiques rivaux, l’avantage potentiel du DQI dans les problèmes d’optimisation et ses applications dans le codage et la cryptographie ont suscité l’enthousiasme au sein de la communauté de l’informatique quantique. Il est considéré comme une avancée significative dans les algorithmes quantiques.

Gemini 2.0 Flash de Google : Un puissant éditeur d'images IA qui soulève des inquiétudes concernant les droits d'auteur

2025-03-17
Gemini 2.0 Flash de Google : Un puissant éditeur d'images IA qui soulève des inquiétudes concernant les droits d'auteur

Le nouveau modèle d'IA Gemini 2.0 Flash de Google possède de puissantes capacités d'édition d'images, notamment la capacité de supprimer facilement les filigranes des images, même celles provenant d'agences de photos connues comme Getty Images. Cette fonctionnalité a suscité des inquiétudes concernant les droits d'auteur, car la suppression de filigranes sans autorisation est généralement illégale en vertu de la loi américaine sur les droits d'auteur. Bien que Google qualifie la fonction d'expérimentale et disponible uniquement pour les développeurs, ses puissantes capacités de suppression de filigranes et l'absence de restrictions d'utilisation en font un outil potentiel de violation des droits d'auteur. D'autres modèles d'IA, tels que Claude 3.7 Sonnet d'Anthropic et GPT-4o d'OpenAI, refusent explicitement de supprimer les filigranes, le considérant comme contraire à l'éthique et potentiellement illégal.

Une startup d'IA neuro-first recherche des ingénieurs pour créer des interfaces cerveau-ordinateur révolutionnaires

2025-03-17
Une startup d'IA neuro-first recherche des ingénieurs pour créer des interfaces cerveau-ordinateur révolutionnaires

Piramidal recrute des ingénieurs de recherche pour construire des systèmes d'IA axés sur les données neuronales, permettant des tâches auparavant impossibles. Les candidats idéaux possèdent de solides compétences en ingénierie, notamment la conception, la mise en œuvre et l'amélioration de systèmes d'apprentissage automatique distribués à grande échelle, et une compréhension fondamentale des neurosciences. L'entreprise offre une rémunération et une participation aux bénéfices compétitives, motivées par une mission visant à valoriser le potentiel humain grâce à la technologie, en défendant la liberté cognitive et en s'opposant à la marchandisation des esprits.

IA

L'IA de Google résout le mystère des superbactéries vieux d'une décennie en seulement deux jours

2025-03-17
L'IA de Google résout le mystère des superbactéries vieux d'une décennie en seulement deux jours

Un nouvel outil d'IA de Google a résolu une énigme scientifique vieille d'une décennie en seulement deux jours : le mécanisme de résistance aux antibiotiques chez les superbactéries. Une équipe de l'Imperial College London a passé 10 ans à rechercher comment certaines superbactéries acquièrent une résistance, mais l'outil d'IA « co-scientifique » de Google, avec une simple instruction, est arrivé à la même réponse que les résultats non publiés de l'équipe en seulement 48 heures. Cela démontre le potentiel de l'IA pour synthétiser des preuves, guider la recherche et concevoir des expériences, révolutionnant potentiellement le progrès scientifique. Cependant, cela soulève également des inquiétudes éthiques et de fiabilité concernant l'utilisation de l'IA dans la recherche scientifique.

Ingénieur IA appliquée fondateur chez Kastle : révolutionner le service hypothécaire grâce à l’IA

2025-03-16
Ingénieur IA appliquée fondateur chez Kastle : révolutionner le service hypothécaire grâce à l’IA

Kastle, une plateforme basée sur l’IA au service des principaux prêteurs hypothécaires américains, recherche un ingénieur IA appliquée fondateur. Soutenue par Y Combinator et d’autres investisseurs de premier plan, Kastle redéfinit le service des prêts. Ce rôle exige plus de 3 ans d’expérience en IA appliquée, une maîtrise de Python et des frameworks d’apprentissage profond, ainsi qu’une expérience du réglage fin des LLM. Les responsabilités incluent l’intégration de l’IA dans sa plateforme, la conception de workflows IA, la garantie de la conformité réglementaire (FDCPA, RESPA, TILA) et l’optimisation des performances et de l’évolutivité. Il s’agit d’une occasion unique de construire les fondations d’une startup IA en forte croissance.

IA

La menace de l'IA sur les dépôts d'accès ouvert

2025-03-16
La menace de l'IA sur les dépôts d'accès ouvert

L'idéal du mouvement d'accès ouvert entre en conflit avec la réalité de l'entraînement des modèles d'IA. Les contributeurs découvrent que leurs œuvres sont exploitées à des fins lucratives, alimentant même des projets néfastes, ce qui soulève des questions sur la durabilité du partage des connaissances. Cet article explore des solutions au-delà des licences restrictives, en préconisant des modèles collaboratifs équitables tels que Wikimedia Enterprise et les signaux de préférence de Creative Commons. La négociation collective peut garantir que les entreprises d'IA compensent équitablement les coûts d'infrastructure, fournissent une attribution et réinvestissent dans le bien commun, réalisant ainsi la vision d'un accès universel au savoir.

Des étudiants du MIT surpassent les bibliothèques HPC de pointe avec des centaines de lignes de code

2025-03-16
Des étudiants du MIT surpassent les bibliothèques HPC de pointe avec des centaines de lignes de code

Des chercheurs du CSAIL du MIT ont développé Exo 2, un nouveau langage de programmation qui permet aux programmeurs d'écrire des « planifications » contrôlant explicitement la façon dont le compilateur génère du code, ce qui conduit à des performances considérablement améliorées. Contrairement aux langages existants à planification utilisateur (USL), Exo 2 permet aux utilisateurs de définir de nouvelles opérations de planification en dehors du compilateur, créant ainsi des bibliothèques de planification réutilisables. Cela permet aux ingénieurs d'obtenir des performances comparables, voire supérieures, à celles des bibliothèques HPC de pointe avec une quantité de code considérablement réduite, révolutionnant l'efficacité des applications d'IA et d'apprentissage automatique.

IA

Évaluation du risque de piratage des agents d'IA : les tests adversaires révèlent des vulnérabilités

2025-03-16
Évaluation du risque de piratage des agents d'IA : les tests adversaires révèlent des vulnérabilités

L'Institut américain pour la sécurité de l'IA (US AISI) a évalué le risque de piratage des agents d'IA à l'aide du framework AgentDojo, en testant le modèle Claude 3.5 Sonnet d'Anthropic. Les principales conclusions mettent en évidence la nécessité d'une amélioration continue des frameworks d'évaluation, d'évaluations adaptatives pour tenir compte de l'évolution des méthodes d'attaque et de l'importance de l'analyse des taux de réussite des attaques spécifiques aux tâches. L'étude a introduit de nouveaux scénarios d'attaque, tels que l'exécution de code à distance, l'exfiltration de bases de données et le phishing automatisé, démontrant leur efficacité dans différents environnements. Cette recherche souligne la nécessité d'améliorations itératives des frameworks d'évaluation de la sécurité de l'IA pour faire face à la menace en constante évolution du piratage des agents d'IA.

Quantitative de Jane Street : Des compétitions de mathématiques au trading piloté par l’IA

2025-03-16
Quantitative de Jane Street : Des compétitions de mathématiques au trading piloté par l’IA

In Young Cho, trader quantitatif chez Jane Street, partage son parcours professionnel atypique, de la pré-médecine au trading quantitatif. Elle raconte ses expériences de stage et de travail chez Jane Street, notamment l’utilisation de langages de programmation comme OCaml et VBA pour le trading et le développement, ainsi que des anecdotes amusantes sur les interactions avec les courtiers. L’épisode explore en profondeur la recherche sur le trading chez Jane Street, des modèles linéaires simples aux réseaux de neurones profonds complexes, et comment ils utilisent l’apprentissage automatique dans des environnements à faibles données, à fort bruit et sujets à de fréquents changements de régime. In Young Cho détaille les quatre étapes de son processus de recherche : exploration, collecte de données, modélisation et production, et discute de la tension entre les outils de recherche flexibles et les systèmes de production robustes. Enfin, elle donne un aperçu des orientations futures de la recherche en apprentissage automatique chez Jane Street, notamment l’extension à davantage de catégories d’actifs et de modalités de données, et l’utilisation de l’IA pour améliorer l’efficacité des traders.

IA

Parahelp : Création de collègues IA remplaçant les agents de support humain

2025-03-15
Parahelp : Création de collègues IA remplaçant les agents de support humain

Parahelp crée un agent de support basé sur l'IA pour les entreprises de logiciels. Son agent utilise l'infrastructure existante (Slack, Stripe, etc.) pour résoudre les tickets de support de bout en bout, dans le but de remplacer complètement les agents de support humain. Ils estiment que le contexte, et non l'intelligence, sera le goulot d'étranglement pour les futurs collègues IA. Lancée en août 2024, Parahelp est soutenue par Y Combinator et des investisseurs de renom, et collabore déjà avec des entreprises leaders comme Perplexity et Framer.

La clinique Mayo résout le problème d'hallucinations des LLM avec RAG inversé

2025-03-15
La clinique Mayo résout le problème d'hallucinations des LLM avec RAG inversé

Les grands modèles de langage (LLM) souffrent d'« hallucinations » - générant des informations inexactes - un problème particulièrement dangereux dans le domaine de la santé. La clinique Mayo a abordé ce problème avec une nouvelle technique de « RAG inversé ». En reliant les informations extraites à leur source originale, cette méthode a éliminé presque toutes les hallucinations basées sur la récupération de données, permettant le déploiement du modèle dans toute sa pratique clinique. La technique combine l'algorithme CURE et des bases de données vectorielles, garantissant la traçabilité de chaque point de données à son origine. Cela améliore la fiabilité et la crédibilité du modèle, réduisant considérablement la charge de travail des médecins et ouvrant de nouvelles voies pour la médecine personnalisée.

Optifye : Startup d'IA pour l'optimisation d'usine recrute une équipe fondatrice

2025-03-15
Optifye : Startup d'IA pour l'optimisation d'usine recrute une équipe fondatrice

Optifye, un système de surveillance des performances d'IA pour les usines, utilise la vision par ordinateur pour identifier et résoudre les inefficacités en temps réel. Ayant déployé avec succès son système auprès de fabricants leaders des secteurs du vêtement, de l'automobile, du médical et des biens de consommation courante sur trois continents, réalisant une augmentation de la productivité de 12 %, elle connaît désormais une croissance rapide après avoir obtenu son diplôme de YC W25. Son objectif ambitieux est de déployer son système sur 100 lignes de production au cours des 4 prochains mois. Elle recherche des ingénieurs expérimentés possédant une expertise approfondie en optimisation GPU/CPU/mémoire, en mise à l'échelle des applications de CV en production, en déploiements cloud conteneurisés (AWS préféré), et une volonté implacable de résoudre des problèmes complexes. Il s'agit d'une opportunité à forte pression et à forte récompense pour les talents de haut niveau.

Douglas Hofstadter fustige le texte « Pourquoi j'ai écrit GEB ? » généré par GPT-4 et exprime ses inquiétudes concernant les LLM

2025-03-15
Douglas Hofstadter fustige le texte « Pourquoi j'ai écrit GEB ? » généré par GPT-4 et exprime ses inquiétudes concernant les LLM

Douglas Hofstadter, pionnier de l'IA, critique vivement un texte généré par GPT-4, intitulé « Pourquoi j'ai écrit GEB ? », censé résumer son œuvre majeure, Gödel, Escher, Bach. Il soutient que le texte est rempli de platitudes génériques, déformant gravement son style d'écriture et la genèse du livre. Hofstadter souligne le manque d'originalité du LLM et sa fabrication d'un récit faux. Il détaille le processus créatif réel derrière GEB, depuis sa fascination initiale pour le théorème d'incomplétude de Gödel jusqu'à l'intégration d'Escher et de Bach, révélant les inspirations et les difficultés vécues. Il exprime de sérieuses inquiétudes concernant la prolifération des LLM et leur potentiel à inonder le monde de faussetés, appelant à une évaluation critique de leurs dangers inhérents.

IA

Report de la mise à jour IA de Siri : difficultés internes et pression chez Apple

2025-03-15
Report de la mise à jour IA de Siri : difficultés internes et pression chez Apple

Une réunion interne de l'équipe Siri d'Apple a révélé que la mise à jour de l'IA de Siri, initialement promise en juin dernier, a été reportée indéfiniment. Cette décision a provoqué anxiété et pression au sein de l'équipe, et a également mis en évidence le retard d'Apple dans la course à l'IA. La réunion a révélé que le report est dû à une réaffectation interne des ressources et à un manque de communication avec le service marketing, entraînant des fonctionnalités survendues. Bien que les dirigeants d'Apple aient assumé la responsabilité du report, l'avenir de Siri reste confronté à de nombreux défis, notamment des problèmes techniques et la gestion des attentes des utilisateurs.

IA

Google Assistant remplacé par Gemini : L’essor de l’IA générative

2025-03-14
Google Assistant remplacé par Gemini : L’essor de l’IA générative

Plus d’un an après son lancement, Google a annoncé que son assistant IA Gemini remplacera Google Assistant sur les téléphones Android fin 2025. Cela marque une étape importante vers l’adoption généralisée de l’IA générative sur les appareils mobiles. Bien que la version initiale de Gemini présentait des fonctionnalités limitées, Google a corrigé cela grâce à des mises à jour continues et à une expansion vers les appareils portables, les voitures, les tablettes et les écouteurs. Google affirme que des millions de personnes sont déjà passées à Gemini, soulignant ses fonctionnalités personnalisées, conscientes du monde et améliorant la productivité. Ce remplacement représente également une décennie d’évolution du traitement du langage naturel, des assistants vocaux basiques à l’IA générative actuelle, montrant une avancée technologique rapide.

IA

Le framework de collaboration multi-agents open source OWL arrive en tête du benchmark GAIA

2025-03-14
Le framework de collaboration multi-agents open source OWL arrive en tête du benchmark GAIA

OWL, un framework de pointe pour la collaboration multi-agents construit sur le framework CAMEL-AI, a atteint la première place du benchmark GAIA avec un score moyen de 58,18 ! Il permet une automatisation des tâches plus naturelle, efficace et robuste dans divers domaines grâce à des interactions dynamiques entre agents. OWL est open source, prend en charge plusieurs méthodes d'installation et des modèles (y compris OpenAI, Qwen et DeepSeek), et dispose d'un riche ensemble de kits d'outils tels que l'automatisation du navigateur, le traitement multi-modal et l'analyse de documents. Une interface utilisateur web conviviale est également fournie. L'équipe OWL recherche activement des contributions de la communauté pour des cas d'utilisation et améliore continuellement le framework.

Des Andes à la psychologie évolutionniste : un voyage scientifique accidentel

2025-03-14
Des Andes à la psychologie évolutionniste : un voyage scientifique accidentel

Une rencontre fortuite avec une femme indigène péruvienne ressemblant étrangement à sa mère a lancé le voyage de l'auteur en psychologie évolutionniste. Cela a mené à une enquête sur les similitudes entre les Asiatiques de l'Est et les Amérindiens, et leur ascendance sibérienne commune. Surmontant la censure idéologique et les défis de financement au sein du monde universitaire, il a mené des recherches de manière indépendante et publié un article sur l'impact des climats extrêmes sur la psychologie humaine. Ses travaux promettent des solutions aux problèmes socioculturels de longue date affectant les sociétés d'Asie de l'Est et tropicales.

Agents IA : effet de mode ou avenir du travail ?

2025-03-14
Agents IA : effet de mode ou avenir du travail ?

La Silicon Valley mise gros sur les agents IA, mais il y a un manque de consensus significatif sur ce qui constitue exactement un agent IA. Des entreprises comme OpenAI, Microsoft et Salesforce les considèrent comme l’avenir du travail, mais leurs fonctionnalités et leurs implémentations varient considérablement. Les définitions vont des systèmes entièrement autonomes aux outils suivant des workflows prédéfinis, ce qui crée une confusion même parmi les experts du secteur. Cette ambiguïté découle des progrès technologiques rapides et du battage médiatique, créant à la fois des opportunités d’innovation et un potentiel de décalage des attentes et de retour sur investissement incertain. En fin de compte, si les agents IA révolutionnent véritablement le monde dépendra de la capacité de l’industrie à établir une définition unifiée.

Prévision probabiliste des séries temporelles : un changement de paradigme dans l'analyse prédictive

2025-03-14
Prévision probabiliste des séries temporelles : un changement de paradigme dans l'analyse prédictive

Dites adieu aux prédictions ponctuelles ! La prévision probabiliste des séries temporelles révolutionne l'analyse prédictive en fournissant des distributions de probabilité complètes des résultats possibles, et non plus de simples valeurs uniques. Cela permet une prise de décision plus nuancée et fiable. Des études montrent des améliorations significatives de la précision des prévisions, une réduction des erreurs et, surtout, une meilleure prédiction des événements extrêmes. Divers secteurs, notamment les services financiers, la santé et la fabrication, tirent parti d'une meilleure évaluation des risques, d'une allocation optimale des ressources et d'une gestion des stocks améliorée. Ce guide complet explore les principes, les méthodes (méthodes bayésiennes, processus gaussiens, modèles probabilistes profonds) et les applications de la prévision probabiliste dans divers domaines. Il aborde également des techniques cruciales telles que le prétraitement des données, la sélection des modèles et le calibrage de l'incertitude.

OpenAI mise sur le plan d'action IA de Trump pour régler les litiges sur les droits d'auteur

2025-03-14
OpenAI mise sur le plan d'action IA de Trump pour régler les litiges sur les droits d'auteur

OpenAI espère que le plan d'action IA de Donald Trump, prévu pour juillet, déclarera l'entraînement de l'IA comme un usage loyal, résolvant ainsi les débats sur les droits d'auteur et accordant aux entreprises d'IA un accès illimité aux données d'entraînement. OpenAI soutient que ceci est crucial pour gagner la course à l'IA contre la Chine. Les tribunaux débattent actuellement de savoir si l'entraînement de l'IA constitue un usage loyal, les détenteurs de droits affirmant que les modèles d'IA menacent leur position sur le marché et diminuent la créativité humaine globale. OpenAI est impliquée dans des dizaines de procès, arguant que l'IA transforme les œuvres protégées par les droits d'auteur et que les sorties de l'IA ne sont pas des substituts aux œuvres originales. OpenAI espère que le plan de Trump évitera des décisions comme celle qui a favorisé les détenteurs de droits, qui a estimé que l'entraînement de l'IA n'était pas un usage loyal car il menaçait de remplacer une firme de recherche juridique. OpenAI suggère que les États-Unis devraient prioriser la « liberté d'apprendre » de l'industrie de l'IA pour éviter que la Chine ne prenne l'avantage en accédant à des données protégées par les droits d'auteur auxquelles les entreprises américaines n'ont pas accès.

Gemini 2.0 de Google : des fonctionnalités IA puissantes désormais gratuites, mais à quel prix ?

2025-03-13
Gemini 2.0 de Google : des fonctionnalités IA puissantes désormais gratuites, mais à quel prix ?

Google s'efforce de faire de Gemini un nom connu, en lançant des mises à jour importantes pour Gemini 2.0. Des améliorations clés, notamment des fonctionnalités avancées telles que la Recherche approfondie améliorée et un modèle de raisonnement utilisant votre historique de recherche, sont désormais disponibles gratuitement. Ce modèle amélioré dispose d'une fenêtre de contexte de 1 million de jetons, de téléchargements de fichiers, d'un traitement plus rapide et d'intégrations avec des applications Google telles que Calendrier et Photos. Bien que Google mette l'accent sur le contrôle de l'utilisateur et la possibilité de désactiver l'accès à l'historique de recherche, des préoccupations concernant la confidentialité persistent.

IA

IA et mathématiques : un choc des cultures et un appel à la collaboration

2025-03-13

La réunion conjointe de mathématiques de 2025 a mis en évidence l’intersection croissante entre l’IA et les mathématiques, révélant un fossé culturel entre les mathématiciens universitaires et les chercheurs en IA de l’industrie. Les mathématiciens privilégient la compréhension, tandis que les chercheurs en IA se concentrent souvent sur les résultats. Cette différence se manifeste dans des approches contrastées de l’ouverture, de la transparence et de la nature même de la preuve. L’article explore l’essence des mathématiques, sa culture et ses valeurs, et examine les applications potentielles de l’IA dans la gestion de la littérature, la vérification des théorèmes et d’autres domaines. L’auteur soutient que l’IA devrait améliorer les capacités mathématiques humaines, et non remplacer les mathématiciens humains, en soulignant la nécessité du respect mutuel et de la collaboration pour faire progresser le domaine.

Le PDG d'Anthropic met en garde contre l'espionnage chinois ciblant les secrets de l'IA américaine

2025-03-13
Le PDG d'Anthropic met en garde contre l'espionnage chinois ciblant les secrets de l'IA américaine

Le PDG d'Anthropic, Dario Amodei, a mis en garde contre le vol probable par des espions chinois de "secrets algorithmiques" précieux détenus par les principales entreprises américaines d'IA, appelant à l'intervention du gouvernement. Il a souligné les antécédents d'espionnage industriel de la Chine et la valeur élevée, potentiellement des centaines de millions de dollars, de fragments de code apparemment simples. Amodei plaide pour une collaboration accrue entre le gouvernement américain et les entreprises d'IA afin de renforcer la sécurité dans les principaux laboratoires d'IA, impliquant potentiellement les agences de renseignement américaines et leurs alliés. Cette préoccupation s'accorde avec les inquiétudes précédemment exprimées par Amodei concernant l'utilisation de l'IA par la Chine à des fins autoritaires et militaires, et ses appels à des contrôles plus stricts des exportations de puces d'IA vers la Chine. Sa position a suscité des critiques de la part de certains qui estiment que la collaboration américano-chinoise en matière d'IA est nécessaire pour éviter une course aux armements de l'IA incontrôlable.

Google DeepMind dévoile Gemini Robotics : une IA pour un contrôle précis des robots

2025-03-12
Google DeepMind dévoile Gemini Robotics : une IA pour un contrôle précis des robots

Google DeepMind a annoncé deux nouveaux modèles d'IA conçus pour contrôler des robots avec une dextérité et une précision sans précédent : Gemini Robotics et Gemini Robotics-ER. Basés sur le grand modèle de langage Gemini 2.0, ces modèles intègrent des capacités de vision-langage-action (VLA) et un raisonnement spatial amélioré. Gemini Robotics permet aux robots de comprendre et d'exécuter des commandes complexes comme « prendre la banane et la mettre dans le panier », tandis que Gemini Robotics-ER se concentre sur l'intégration transparente avec les systèmes de contrôle robotiques existants. Ceci représente un progrès significatif en robotique, notamment dans la manipulation d'actions physiques complexes et la démonstration de fortes capacités de généralisation. Google s'associe à Apptronik pour construire la prochaine génération de robots humanoïdes utilisant Gemini 2.0, démontrant le potentiel d'une adoption généralisée. Cependant, Google souligne également l'importance de la sécurité, en publiant le jeu de données "ASIMOV" pour aider les chercheurs à évaluer les implications de sécurité des actions robotiques.

IA

Gemini 2.0 Flash : Le modèle de génération d'images natif de Google est disponible pour les développeurs

2025-03-12
Gemini 2.0 Flash : Le modèle de génération d'images natif de Google est disponible pour les développeurs

Google a publié Gemini 2.0 Flash, un modèle d'IA multimodal doté d'un raisonnement amélioré et d'une compréhension du langage naturel, capable de générer des images. Il peut créer des histoires avec du texte et des images, permettre l'édition d'images par le biais de conversations et générer des images contenant de longues séquences de texte bien formatées. Disponible pour l'expérimentation des développeurs sur Google AI Studio et l'API Gemini, Gemini 2.0 Flash promet des possibilités passionnantes pour la création d'agents d'IA et d'applications visuellement riches.

Google DeepMind dévoile Gemini Robotics : pour une nouvelle génération de robots

2025-03-12
Google DeepMind dévoile Gemini Robotics : pour une nouvelle génération de robots

Google DeepMind a présenté deux nouveaux modèles d'IA basés sur Gemini 2.0 : Gemini Robotics et Gemini Robotics-ER, permettant aux robots d'effectuer un plus large éventail de tâches du monde réel. Gemini Robotics est un modèle avancé de vision-langage-action qui contrôle directement les robots ; Gemini Robotics-ER possède une compréhension spatiale avancée, permettant aux roboticiens d'exécuter leurs propres programmes en utilisant les capacités de raisonnement incarné de Gemini. Les deux modèles sont caractérisés par leur généralité, leur interactivité et leur dextérité, capables de gérer diverses tâches et environnements, et de mieux collaborer avec les humains. DeepMind a également publié un nouveau jeu de données, ASIMOV, pour évaluer et améliorer la sécurité sémantique dans l'IA incarnée et la robotique, et s'est associé à des entreprises comme Apptronik pour développer la prochaine génération de robots humanoïdes.

Gemma de Google : une famille de modèles multimodaux légers

2025-03-12
Gemma de Google : une famille de modèles multimodaux légers

Google a dévoilé Gemma, une famille légère de modèles multimodaux basés sur la technologie Gemini. Les modèles Gemma 3 traitent le texte et les images, disposent d'une fenêtre de contexte de 128 K et prennent en charge plus de 140 langues. Disponibles en tailles de paramètres de 1B, 4B, 12B et 27B, ils excellent dans des tâches telles que la réponse aux questions, la summarisation et le raisonnement, tandis que leur conception compacte permet leur déploiement sur des appareils aux ressources limitées. Les résultats des benchmarks montrent de solides performances sur diverses tâches, notamment en matière de capacités multilingues et multimodales.

1 2 29 30 31 33 35 36 37 40 41