Category: IA

Les couche-tard et la dépression : la pleine conscience pourrait être la clé

2025-03-23
Les couche-tard et la dépression : la pleine conscience pourrait être la clé

Une étude menée auprès de jeunes adultes révèle un lien étroit entre les chronotypes vespéraux (couche-tard) et des taux plus élevés de symptômes dépressifs. Les chercheurs ont étudié la pleine conscience, la rumination, la consommation d'alcool et la qualité du sommeil comme médiateurs potentiels. Les résultats montrent que ces facteurs modèrent significativement la relation, l'« agir avec conscience » — un aspect de la pleine conscience — offrant des effets protecteurs particuliers contre la dépression. Cette recherche suggère de nouvelles stratégies d'intervention pour améliorer la santé mentale des jeunes adultes.

Les LLM révolutionnent les systèmes de recommandation et de recherche : Une étude complète

2025-03-23
Les LLM révolutionnent les systèmes de recommandation et de recherche : Une étude complète

Cet article examine les recherches récentes appliquant les grands modèles de langage (LLM) aux systèmes de recommandation et aux moteurs de recherche. Les études explorent diverses approches, notamment les architectures de modèles augmentées par LLM (par exemple, les ID sémantiques de YouTube et le M3CSR de Kuaishou), l’utilisation des LLM pour la génération et l’analyse de données (par exemple, l’amélioration de la qualité des recommandations de Bing et la mauvaise correspondance attendue d’Indeed), et l’adoption de méthodologies d’entraînement des LLM (par exemple, les lois d’échelle, l’apprentissage par transfert et la distillation des connaissances). En outre, la recherche se concentre sur les architectures unifiées pour les systèmes de recommandation et les moteurs de recherche, telles que 360Brew de LinkedIn et UniCoRn de Netflix, afin d’améliorer l’efficacité et les performances. Globalement, ces études démontrent le potentiel significatif des LLM pour améliorer les systèmes de recommandation et les moteurs de recherche, produisant des résultats concrets dans le monde réel.

Impact économique de l'IA : Automatisation de la main-d'œuvre, et pas seulement la R&D ?

2025-03-22
Impact économique de l'IA : Automatisation de la main-d'œuvre, et pas seulement la R&D ?

Un point de vue répandu affirme que l'impact économique principal de l'IA sera l'automatisation de la R&D. Cet article conteste cette idée, en arguant que la valeur économique de la R&D est surestimée, contribuant beaucoup moins à la croissance de la productivité qu'on ne le pense généralement. Les auteurs soutiennent que la valeur économique de l'IA proviendra principalement de l'automatisation généralisée de la main-d'œuvre, conduisant à des augmentations significatives de la productivité et de la production, et pas seulement aux progrès de la R&D. Bien que l'IA finisse par automatiser la R&D, cela se produira probablement après une automatisation plus large, une fois que l'IA possédera les capacités nécessaires pour gérer un éventail plus large de tâches.

IA

Les six vagues du codage vibe et l'avenir de la programmation

2025-03-22
Les six vagues du codage vibe et l'avenir de la programmation

Cet article explore l'évolution du codage IA, du codage traditionnel à la complétion de code, au codage conversationnel, aux agents de codage, aux clusters d'agents et enfin aux flottes d'agents. L'auteur prédit que les agents de codage augmenteront considérablement l'efficacité du développement, mais entraîneront également des coûts élevés. Le rôle futur des programmeurs évoluera vers la gestion et la coordination des agents IA. L'article souligne que les jeunes programmeurs adoptent l'IA plus facilement que les développeurs expérimentés, remodelant la structure des talents de l'industrie du développement logiciel. L'auteur conclut qu'apprendre à utiliser efficacement les agents de codage est crucial pour le succès futur dans le domaine.

Standardisation des préférences en IA : résolution des problèmes de droit d’auteur dans les données d’entraînement de l’IA

2025-03-22
Standardisation des préférences en IA : résolution des problèmes de droit d’auteur dans les données d’entraînement de l’IA

Pour répondre aux préoccupations relatives aux droits d’auteur découlant de l’utilisation de contenu Internet pour l’entraînement de modèles d’IA, le groupe de travail nouvellement créé sur les préférences en IA (AIPREF) de l’IETF travaille à la standardisation des éléments constitutifs permettant d’exprimer des préférences sur la manière dont le contenu est collecté et traité. Actuellement, les fournisseurs d’IA utilisent un ensemble confus de signaux non standard (tels que robots.txt) pour guider leurs décisions de crawl et d’entraînement, ce qui entraîne un manque de confiance chez les auteurs et les éditeurs quant au respect de leurs préférences. L’AIPREF définira un vocabulaire commun pour exprimer les préférences des auteurs et des éditeurs, des méthodes pour joindre ce vocabulaire au contenu Internet et un mécanisme standard pour concilier les multiples expressions de préférences. La première réunion du groupe de travail aura lieu lors de l’IETF 122 à Bangkok.

IA

Les limites du scaling en IA : la force brute arrive-t-elle à ses limites ?

2025-03-22
Les limites du scaling en IA : la force brute arrive-t-elle à ses limites ?

Une enquête menée auprès de 475 chercheurs en IA révèle que le simple fait d'augmenter l'échelle des approches actuelles de l'IA ne mènera probablement pas à une intelligence artificielle générale (AGI). Malgré les investissements massifs dans les centres de données par les géants de la technologie, les rendements décroissants sont évidents. Le dernier modèle GPT d'OpenAI montre des améliorations limitées, tandis que DeepSeek démontre des performances d'IA comparables pour une fraction du coût et de la consommation d'énergie. Cela suggère que des méthodes moins chères et plus efficaces, telles que le calcul au moment du test d'OpenAI et l'approche « mélange d'experts » de DeepSeek, sont l'avenir. Cependant, les grandes entreprises continuent de privilégier le scaling par la force brute, laissant les startups plus petites explorer des alternatives plus économiques.

IA

Coéquipier IA : Une expérience sur le terrain montre que l’IA générative remodèle le travail d’équipe et l’expertise

2025-03-22
Coéquipier IA : Une expérience sur le terrain montre que l’IA générative remodèle le travail d’équipe et l’expertise

Un essai contrôlé randomisé chez Procter & Gamble révèle que l’IA générative augmente significativement la productivité de l’équipe et la qualité des solutions. Les individus utilisant l’IA ont obtenu des résultats aussi bons que les équipes sans IA, tandis que les équipes utilisant l’IA ont excellé, augmentant considérablement la probabilité d’obtenir des solutions de premier ordre. L’IA a non seulement amélioré l’efficacité, mais a également accru les émotions positives, comblé les silos départementaux et permis aux employés moins expérimentés d’atteindre les niveaux de performance des membres d’équipe expérimentés. Cette recherche suggère que l’IA n’est pas seulement un outil de productivité, mais un « coéquipier » capable de remodeler le travail d’équipe et les structures organisationnelles.

IA

Décryptage de R1-Zero : Alignement efficace des LLMs avec le framework Oat

2025-03-22
Décryptage de R1-Zero : Alignement efficace des LLMs avec le framework Oat

Des chercheurs ont publié un article, des modèles et une base de code révélant les mystères de l'entraînement de type R1-Zero. Ils ont développé Oat, un framework d'apprentissage par renforcement LLM hautement modulaire et efficace, et l'ont utilisé pour entraîner des modèles de type R1-Zero tels que Qwen2.5. L'étude a révélé que des modèles de base appropriés et un algorithme d'apprentissage par renforcement amélioré (Dr. GRPO) sont cruciaux, évitant l'optimisation biaisée des modèles et des ensembles de questions incompatibles. Ils ont finalement obtenu des performances de pointe avec seulement 27 heures de calcul sur 8 GPU A100.

IA

Meta et OpenAI accusées d'avoir utilisé une base de données piratée pour entraîner des modèles d'IA

2025-03-22
Meta et OpenAI accusées d'avoir utilisé une base de données piratée pour entraîner des modèles d'IA

Meta et OpenAI sont impliquées dans une controverse sur le droit d'auteur après qu'il a été révélé qu'elles avaient utilisé la base de données de livres piratée Library Genesis (LibGen) pour entraîner leurs modèles d'IA. Afin d'accélérer l'entraînement de son modèle Llama 3, Meta a contourné les processus de licence coûteux et a téléchargé directement des millions de livres et d'articles de recherche de LibGen. Cette action a donné lieu à un procès intenté par des auteurs, des documents judiciaires révélant que les employés de Meta ont reconnu les risques juridiques et ont tenté de dissimuler leurs actions. OpenAI a également admis avoir utilisé LibGen par le passé, mais affirme que ses modèles les plus récents ne reposent plus sur cet ensemble de données. L'incident met en lumière les défis éthiques et juridiques liés à l'origine des données d'entraînement pour les modèles d'IA et à la protection de la propriété intellectuelle.

FutureHouse : Construction de scientifiques IA semi-autonomes

2025-03-22
FutureHouse : Construction de scientifiques IA semi-autonomes

FutureHouse, un organisme à but non lucratif basé à San Francisco, a pour mission d'automatiser la découverte scientifique à l'aide de l'IA. Ils ont développé une suite d'outils sur le thème du "corbeau", notamment ChemCrow pour la conception de réactions chimiques, WikiCrow pour la synthèse d'informations sur les protéines, ContraCrow pour l'identification des contradictions dans la littérature et la série PaperQA pour des requêtes PDF fiables. FutureHouse vise à construire des scientifiques IA semi-autonomes, allant de modèles prédictifs à des robots humanoïdes capables un jour d'exécuter des expériences de manière indépendante, accélérant ainsi la découverte scientifique et résolvant des problèmes tels que la difficulté de résumer et le manque de fiabilité de la littérature biomédicale. Les défis incluent la construction d'infrastructures, l'accès aux données et la résolution de problèmes d'ingénierie, mais les modèles d'IA excellent dans la génération d'hypothèses et l'élaboration de conclusions. FutureHouse met l'accent sur la fiabilité des scientifiques IA et s'engage à résoudre les problèmes grâce à une analyse de données améliorée et à la reproductibilité.

Hunyuan-T1 de Tencent : Redéfinition de l'efficacité du raisonnement avec le premier modèle ultralarge alimenté par Mamba

2025-03-22

Tencent a dévoilé Hunyuan-T1, le dernier né de sa série de modèles linguistiques de grande taille Hunyuan. Construit sur TurboS, le premier modèle ultralarge hybride Transformer-Mamba MoE au monde, Hunyuan-T1 possède des capacités de raisonnement significativement améliorées et un meilleur alignement avec les préférences humaines après un entraînement postérieur intensif. Comparé à sa version préliminaire, Hunyuan-T1 affiche une amélioration substantielle des performances, doublant sa vitesse de décodage. Il obtient des résultats comparables ou légèrement supérieurs à R1 sur diverses références publiques, et surpasse R1 lors d'évaluations humaines internes, notamment en matière de suivi d'instructions culturelles et créatives, de résumé de texte et de capacités d'agent. Cette sortie marque une avancée significative dans l'exploitation de l'apprentissage par renforcement pour l'optimisation post-entraînement des modèles linguistiques de grande taille.

IA

IA outil vs. IA agent : un jeu de contrôle et de capacité

2025-03-21
IA outil vs. IA agent : un jeu de contrôle et de capacité

Cet article remet en question l'efficacité de limiter l'IA à des tâches purement informationnelles (IA outil) pour atténuer les risques. L'auteur soutient que cette approche est irréalisable car les IA agent, capables de prendre des actions, possèdent des avantages économiques et intellectuels. Les IA agent excellent dans la sélection des données, l'optimisation de l'apprentissage, l'auto-conception et l'utilisation des ressources externes, conduisant à une intelligence supérieure. Bien que l'apprentissage par renforcement ne soit pas idéal pour apprendre des choses complexes à partir de zéro, c'est la meilleure approche pour contrôler des systèmes complexes – et le monde en est plein, y compris les IA. Les IA outil seront finalement supplantées par les IA agent car ces dernières répondent mieux aux demandes du marché et aux applications pratiques.

IA

Jagged Flash Attention de Meta : Révolution dans les performances des systèmes de recommandation

2025-03-21
Jagged Flash Attention de Meta : Révolution dans les performances des systèmes de recommandation

Meta présente Jagged Flash Attention, une innovation qui transforme les performances et l'évolutivité des systèmes de recommandation à grande échelle. Les méthodes traditionnelles ont des difficultés avec les caractéristiques catégorielles de longueur variable (comme l'historique des interactions de l'utilisateur), nécessitant un padding excessif. Jagged Flash Attention gère efficacement ces caractéristiques en utilisant des tenseurs irréguliers, éliminant la surcharge de padding. Combiné avec la bibliothèque TorchRec, il offre des améliorations de performances jusqu'à 10 fois dans l'environnement de production de Meta et prend en charge l'entraînement de modèles avec plus de 3 billions de paramètres. Cette innovation fait progresser significativement les systèmes de recommandation personnalisés.

L'utilisation de ChatGPT liée à une augmentation de la solitude : étude OpenAI et MIT

2025-03-21
L'utilisation de ChatGPT liée à une augmentation de la solitude : étude OpenAI et MIT

Une nouvelle recherche d'OpenAI et du MIT suggère que l'utilisation accrue de chatbots comme ChatGPT peut être corrélée à une plus grande solitude et à moins d'interactions sociales. Une étude ayant suivi près de 1 000 utilisateurs pendant un mois a révélé que ceux qui passaient plus de temps avec ChatGPT rapportaient une plus grande dépendance émotionnelle et une plus grande solitude. Bien que peu aient utilisé ChatGPT pour un soutien émotionnel, l'étude a indiqué que les personnes prédisposées à la dépendance émotionnelle pourraient ressentir une solitude exacerbée. Les chercheurs soulignent la nécessité de poursuivre les recherches sur l'impact de l'IA sur le bien-être humain et la conception responsable de l'IA.

IA

PocketFlow : Un nouveau framework pour construire des systèmes d'IA prêts pour l'entreprise

2025-03-21
PocketFlow : Un nouveau framework pour construire des systèmes d'IA prêts pour l'entreprise

PocketFlow est un framework LLM basé sur TypeScript utilisant une structure de graphe orienté imbriqué. Cela décompose les tâches complexes d'IA en étapes LLM réutilisables, permettant la ramification et la récursivité pour une prise de décision de type agent. Le framework est facilement extensible, intégrant divers LLMs et APIs sans wrappers spécialisés, et dispose d'un débogage de workflow visuel et de la persistance d'état, accélérant la construction de systèmes d'IA de niveau entreprise.

Preuves à divulgation nulle de connaissance expliquées : Plongeon en profondeur dans la vidéo

2025-03-21
Preuves à divulgation nulle de connaissance expliquées : Plongeon en profondeur dans la vidéo

L’auteur a publié une vidéo expliquant les preuves à divulgation nulle de connaissance, un algorithme complexe qui, étonnamment, nécessite beaucoup de travail pour être expliqué clairement. Bien que la vidéo couvre divers aspects et applications, elle reconnaît le besoin de ressources plus approfondies pour une compréhension complète. L’article détaille en outre la réduction des problèmes de satisfiabilité à la 3-coloration, en discutant des implications pour les systèmes décentralisés tels que les systèmes de vote et de monnaie sans confiance. Enfin, il introduit les preuves non interactives, en montrant comment les fonctions de hachage cryptographiques peuvent simuler un balise aléatoire pour les créer, unifiant efficacement les sujets de vidéos récentes.

CSAM généré par IA : un affrontement avec le Premier Amendement

2025-03-20
CSAM généré par IA : un affrontement avec le Premier Amendement

Une affaire récente devant un tribunal de district américain impliquant du matériel d'abus sexuel sur mineur (CSAM) généré par IA a déclenché un débat sur le Premier Amendement. Le tribunal a statué que la possession privée de CSAM virtuel généré par IA est protégée par le Premier Amendement, mais pas la production et la distribution. Cette affaire met en lumière les défis et les complexités juridiques auxquels sont confrontées les forces de l'ordre dans la lutte contre l'exploitation et les abus sexuels sur mineur facilités par l'IA.

IA Droit

Google Gemma 3 : Une mise à jour majeure de son modèle d’IA à accélérateur unique

2025-03-20
Google Gemma 3 : Une mise à jour majeure de son modèle d’IA à accélérateur unique

Plus d’un an après la sortie des modèles d’IA Gemma initiaux, Google dévoile Gemma 3, affichant des performances supérieures à celles de ses concurrents comme Llama et OpenAI, notamment sur les systèmes à GPU unique. Ce modèle amélioré prend en charge plus de 35 langues et traite du texte, des images et de courtes vidéos. Gemma 3 est doté d’un encodeur de vision amélioré pour les images haute résolution et non carrées, et inclut le nouveau classificateur de sécurité d’images ShieldGemma 2 pour filtrer les contenus inappropriés. Bien que la définition de « ouvert » reste sujette à débat en ce qui concerne sa licence, Google continue de promouvoir Gemma 3 via des crédits Google Cloud et un programme académique offrant 10 000 $ de crédits pour la recherche.

IA

Les hallucinations de ChatGPT entraînent une nouvelle plainte pour violation de la vie privée contre OpenAI

2025-03-20
Les hallucinations de ChatGPT entraînent une nouvelle plainte pour violation de la vie privée contre OpenAI

OpenAI fait face à une nouvelle plainte pour violation de la vie privée en Europe concernant la tendance de ChatGPT à inventer de fausses informations. Noyb soutient un utilisateur norvégien faussement accusé par ChatGPT d'avoir assassiné deux enfants et tenté d'en tuer un troisième. Cela souligne les risques des « hallucinations » des modèles de langage de grande taille et les exigences de précision du RGPD. Bien qu'OpenAI propose des solutions, comme le blocage des invites, cela est insuffisant au regard du droit de rectification du RGPD. L'affaire pourrait entraîner des amendes pouvant atteindre 4 % du chiffre d'affaires annuel et obliger OpenAI à modifier ses produits d'IA, impactant ainsi l'ensemble du secteur.

IA

Pump : Optimisation des coûts cloud grâce à l'IA, économisez 60 %

2025-03-20
Pump : Optimisation des coûts cloud grâce à l'IA, économisez 60 %

Les dépenses cloud atteignent le chiffre astronomique de 500 milliards de dollars par an, représentant la catégorie de dépenses à la croissance la plus rapide pour les entreprises technologiques. Pump propose une plateforme alimentée par l'IA qui automatise les économies et exploite les achats groupés pour réduire les coûts cloud jusqu'à 60 %. Soutenu par Y Combinator, l'équipe expérimentée de Pump construit une culture d'entreprise transparente, collaborative et dynamique axée sur la réussite.

Claude recherche désormais sur le Web : des réponses plus précises et plus actuelles

2025-03-20
Claude recherche désormais sur le Web : des réponses plus précises et plus actuelles

Le modèle d'IA Claude d'Anthropic intègre désormais la recherche Web pour fournir des réponses plus précises et plus actuelles. Claude accède aux événements et aux informations les plus récents, en citant directement les sources pour faciliter la vérification des faits. Cette fonctionnalité est actuellement disponible en préversion pour les utilisateurs payants aux États-Unis, avec un support pour les plans gratuits et l'international prochainement. Cette amélioration permet à Claude d'aider dans les ventes, l'analyse financière, la recherche et les achats en analysant les tendances, en évaluant les données du marché, en créant des rapports de recherche et en comparant les détails des produits.

Le coûteux o1-pro d'OpenAI : une IA de raisonnement puissante, mais est-ce justifié ?

2025-03-20
Le coûteux o1-pro d'OpenAI : une IA de raisonnement puissante, mais est-ce justifié ?

OpenAI a lancé o1-pro, un modèle d'IA de raisonnement plus puissant, via son API pour développeurs. Bien qu'il se vante de performances supérieures et de réponses plus fiables grâce à une puissance de calcul accrue, o1-pro a un prix élevé : 150 $ par million de jetons d'entrée et 600 $ par million de jetons de sortie – soit le double du coût d'entrée de GPT-4.5 et dix fois celui de o1. Cependant, les premiers tests ont révélé des résultats mitigés, avec des difficultés sur des tâches comme les puzzles Sudoku et les illusions d'optique. Des benchmarks internes ont montré des performances légèrement supérieures à celles de o1 sur les problèmes de codage et de mathématiques, mais avec une fiabilité améliorée. Le pari d'OpenAI est de savoir si la fiabilité améliorée justifie le coût exorbitant pour les développeurs.

IA

Plan de cours d'apprentissage profond : des perceptrons aux transformateurs

2025-03-20

Ce plan de cours couvre un large éventail de sujets d'apprentissage profond, des premiers perceptrons et algorithmes de rétropropagation aux réseaux neuronaux convolutionnels (CNN), réseaux neuronaux récurrents (RNN) et modèles Transformer modernes. Le cours expliquera progressivement les techniques d'entraînement des réseaux neuronaux, notamment les algorithmes d'optimisation et les méthodes de régularisation. Des sujets avancés tels que la prévision des séries chronologiques, la prévision séquence à séquence et les réseaux antagonistes génératifs (GAN) seront également abordés. Le cours sera évalué au moyen d'une série de conférences, de devoirs et de quiz.

IA

Bolt3D : Génération de scènes 3D en quelques secondes

2025-03-19
Bolt3D : Génération de scènes 3D en quelques secondes

Bolt3D, fruit d'une collaboration entre Google Research, VGG et Google DeepMind, génère des scènes 3D réalistes en seulement 6,25 secondes sur une seule GPU. Le modèle utilise un modèle de diffusion multi-vues pour générer l'apparence et la géométrie de la scène, puis régresse des images de projection à l'aide d'une tête gaussienne. Enfin, il combine des gaussiennes 3D provenant de plusieurs images de projection pour former la scène 3D complète. Prenant en charge une ou plusieurs images d'entrée, Bolt3D génère des régions de scène non observées sans mécanismes de reprojection ou de peinture, marquant un progrès significatif dans la vitesse de génération de scènes 3D.

Agents LLM : étonnamment simples !

2025-03-19
Agents LLM : étonnamment simples !

Ce guide démystifie le fonctionnement interne des agents LLM. À l'aide d'une analogie simple de cuisine, il explique comment les systèmes d'agents sont construits sous forme de graphes : les nœuds représentent les postes de cuisson, le flux représente la recette et le stockage partagé représente le comptoir. Chaque nœud prépare, exécute et publie des résultats ; le flux détermine le nœud suivant en fonction des décisions. L'auteur utilise le framework PocketFlow (seulement 100 lignes de code) pour illustrer comment les agents fonctionnent via des nœuds de décision, des nœuds d'action et des nœuds finaux, en soulignant leur structure de graphe fondamentale plutôt que des algorithmes complexes. Tout est question de boucles et de ramifications !

Archives Numériques Personnelles : Des Trésors de Données Uniques à l'Ère de l'IA

2025-03-19
Archives Numériques Personnelles : Des Trésors de Données Uniques à l'Ère de l'IA

Dans sa dernière newsletter bi-hebdomadaire, Linda explore la valeur des archives numériques personnelles. Elle soutient que, à l'ère actuelle de l'IA générative qui tend vers la médiocrité, ces archives, contenant des expériences, des préférences et des perspectives personnelles uniques, deviennent des ressources précieuses pour entraîner des modèles d'IA et créer des œuvres plus personnalisées. L'article utilise l'expérience personnelle de l'auteure de collecter des livres, des images et des liens comme exemple, et combine les perspectives d'historiens pour illustrer l'importance des archives personnelles à l'ère de l'IA. Plusieurs exemples d'archives personnelles en Finlande sont également fournis. Enfin, l'auteure invite les lecteurs à partager leurs propres objets et histoires collectés, mettant en valeur la richesse et le charme unique des archives personnelles.

Nvidia Isaac GR00T N1 : L'ère de la robotique généraliste est arrivée

2025-03-19
Nvidia Isaac GR00T N1 : L'ère de la robotique généraliste est arrivée

Nvidia a lancé Isaac GR00T N1, un modèle de base open-source et pré-entraîné pour les robots humanoïdes, marquant l'arrivée de l'ère de la robotique généraliste. Ce modèle à double système, inspiré de la cognition humaine, comprend un « Système 1 » d'action rapide et un « Système 2 » plus lent, basé sur un modèle de langage visuel, pour le raisonnement. Avec un minimum de données de post-entraînement, il permet des tâches complexes comme la préhension et la manipulation d'objets. 1X Technologies l'a déployé avec succès sur son robot humanoïde NEO Gamma pour des tâches de rangement autonomes. La nature open-source et la capacité de personnalisation du modèle promettent d'accélérer considérablement le développement des robots humanoïdes et de stimuler les avancées en IA.

IA

NVIDIA Dynamo : Framework d'inférence haute performance et faible latence pour l'IA générative

2025-03-18
NVIDIA Dynamo : Framework d'inférence haute performance et faible latence pour l'IA générative

NVIDIA présente Dynamo, un framework d'inférence haute performance et faible latence conçu pour servir les modèles d'IA générative et de raisonnement dans des environnements distribués multinœuds. Dynamo est agnostique du moteur d'inférence (compatible avec TRT-LLM, vLLM, SGLang et autres), et intègre des fonctionnalités telles que l'inférence de préremplissage et de décodage désagrégée, l'ordonnancement dynamique du GPU, le routage des requêtes conscient des LLM, le transfert de données accéléré et la décharge du cache KV pour maximiser le débit du GPU et minimiser la latence. Développé en Rust pour les performances et en Python pour l'extensibilité, Dynamo est entièrement open source.

Llama de Meta atteint 1 milliard de téléchargements, visant la domination de l'IA open source

2025-03-18
Llama de Meta atteint 1 milliard de téléchargements, visant la domination de l'IA open source

Le PDG de Meta, Mark Zuckerberg, a annoncé que le modèle d'IA open source de l'entreprise, Llama, a dépassé le milliard de téléchargements, soit une augmentation de 53 % depuis début décembre 2024. Alors qu'il alimente l'assistant IA de Meta et est utilisé par des entreprises comme Spotify et AT&T, Llama fait face à des poursuites pour violation de droits d'auteur et à des préoccupations concernant la confidentialité des données. Néanmoins, Meta prévoit de lancer d'autres modèles Llama, notamment des modèles de raisonnement et des modèles multimodaux, et investit 80 milliards de dollars dans l'IA cette année, dans le but de dominer le secteur de l'IA.

IA

Sesame AI publie un modèle de parole conversationnel de 1 milliard de paramètres

2025-03-18
Sesame AI publie un modèle de parole conversationnel de 1 milliard de paramètres

Les laboratoires Sesame AI ont publié CSM (Conversational Speech Model), un modèle de génération de parole de 1 milliard de paramètres basé sur l'architecture Llama. CSM génère des codes audio RVQ à partir d'entrées texte et audio, et son point de contrôle est disponible sur Hugging Face. Une démo vocale interactive et un espace Hugging Face pour tester la génération audio sont également fournis. Bien qu'il soit capable de produire des voix variées, CSM n'a pas été finement ajusté sur des voix spécifiques et a un support multilingue limité. Sesame AI souligne son utilisation à des fins de recherche et d'éducation uniquement, interdisant l'usurpation d'identité, la désinformation et les activités illégales.

1 2 28 29 30 32 34 35 36 40 41