Webtagr - Résumé de news de technologie

Psychédéliques et respiration : une nouvelle ère pour le traitement des maladies mentales ?

2025-04-17

Des études récentes ont montré des résultats prometteurs pour les thérapies assistées par des psychédéliques, tels que la psilocybine et la MDMA, dans le traitement de la dépression résistante au traitement et du trouble de stress post-traumatique (TSPT). De nombreux essais cliniques indiquent des améliorations substantielles et durables. Simultanément, les thérapies respiratoires, y compris le Holotropic Breathwork, gagnent du terrain, la recherche suggérant une efficacité dans la réduction du stress, de l'anxiété et de la dépression. Ces thérapies semblent agir en modifiant l'activité cérébrale et les niveaux de neurotransmetteurs, impactant ainsi l'humeur et l'état mental. Bien que des recherches supplémentaires soient nécessaires pour confirmer l'efficacité et la sécurité, ces résultats offrent un nouvel espoir pour le traitement des maladies mentales et ouvrent des voies intéressantes pour explorer les mystères du cerveau et de la conscience.

(www.nature.com)

IA thérapie psychédélique thérapie respiratoire traitement des maladies mentales

UniK3D : Estimation 3D monoculaire universelle pour caméra

2025-04-17

UniK3D révolutionne la reconstruction 3D monoculaire en estimant avec précision des scènes 3D métriques à partir d'images uniques, quel que soit le type de caméra. Contrairement aux méthodes précédentes qui reposaient sur des hypothèses simplifiées, UniK3D prédit directement des points 3D sans information supplémentaire. Son innovation principale réside dans une représentation 3D sphérique et une nouvelle représentation de la caméra, surmontant les limitations des approches traditionnelles dans les configurations grand angle et panoramiques. L'évaluation sans données de test préalable sur 13 ensembles de données divers démontre des performances de pointe en termes de métriques 3D, de profondeur et de caméra, excellant particulièrement dans les scénarios difficiles à grand champ de vision. Le code et les modèles sont disponibles sur GitHub.

(lpiccinelli-eth.github.io)

IA

Les nouveaux modèles de raisonnement d'image de ChatGPT soulèvent des inquiétudes concernant la vie privée

2025-04-17

Les derniers modèles d'IA d'OpenAI, o3 et o4-mini, peuvent identifier avec précision l'emplacement des photos en se basant sur des indices visuels, allant même jusqu'à identifier des restaurants et des bars spécifiques. Cette capacité, mise en évidence sur les réseaux sociaux, a suscité des inquiétudes concernant les risques pour la vie privée, car des acteurs malveillants pourraient l'utiliser pour le doxing. Des tests révèlent que même des modèles plus anciens comme GPT-4o présentent des capacités similaires de devinette d'emplacement, bien que o3 les surpasse parfois. Bien qu'il ne soit pas parfait, avec des cas de mauvaises estimations et de pannes du système, les performances de o3 mettent en lumière les risques émergents des puissants modèles d'IA de raisonnement. OpenAI n'a pas encore abordé ces préoccupations dans son rapport de sécurité.

(techcrunch.com)

IA

Google dévoile Gemini 2.5 Flash : un modèle d'IA avec raisonnement contrôlable

2025-04-17

Google a lancé Gemini 2.5 Flash, un nouveau modèle de langage large doté de capacités de raisonnement contrôlables. S'appuyant sur le populaire 2.0 Flash, il améliore considérablement le raisonnement tout en privilégiant la vitesse et la rentabilité. Les développeurs peuvent ajuster un « budget de pensée » pour trouver le bon compromis entre qualité, coût et latence. Le modèle ajuste automatiquement son processus de pensée en fonction de la complexité de l'invite, offrant des modes allant de l'absence de pensée à un raisonnement intensif. Gemini 2.5 Flash excelle dans les Hard Prompts de LMArena, offrant un excellent rapport qualité-prix, ce qui en fait l'un des modèles de pensée les plus économiques disponibles.

(developers.googleblog.com)

IA Modèle de Langage Large Raisonnement Contrôlable

Accès aux meilleurs modèles d'IA de OpenAI, Google et plus

2025-04-17

Une nouvelle plateforme offre un accès unifié aux modèles d'IA de pointe de sociétés leaders comme OpenAI, Google, Anthropic, DeepSeek, Mistral et Meta. Cela inclut des modèles tels que ChatGPT-4, Claude, Gemini et Llama, permettant aux utilisateurs d'explorer les capacités uniques de chacun. Ceci représente une avancée majeure en termes d'accessibilité à la technologie d'IA de pointe, ouvrant de nouvelles possibilités aux développeurs et chercheurs.

(zuni.app)

IA

Le responsable de la sécurité d'OpenAI démissionne au milieu des inquiétudes concernant la sécurité

2025-04-17

Le responsable de la préparation d'OpenAI, Joaquin Quiñonero Candela, a récemment démissionné de son poste et est passé à un stage interne. Cela fait suite à une série de départs très médiatisés des équipes de sécurité d'OpenAI, à la restructuration de l'organisation de sécurité et à des informations faisant état d'une réduction des temps de test de sécurité. Les événements soulèvent des inquiétudes concernant l'engagement d'OpenAI envers la sécurité de l'IA, notamment compte tenu du récent lancement de GPT-4.1 sans rapport de sécurité et des informations faisant état de périodes de test de sécurité réduites. La situation met en évidence une possible priorité accordée au lancement du produit par rapport aux considérations de sécurité, contrastant avec les engagements publics antérieurs d'OpenAI et générant des discussions plus larges sur la réglementation de la sécurité de l'IA.

(garrisonlovely.substack.com)

IA

La mise à jour de la mémoire d'OpenAI : un bond en avant transformateur pour l'IA

2025-04-17

Les mises à jour de la mémoire d'OpenAI marquent le début de ce qui pourrait être le changement le plus transformateur depuis les débuts de GPT-3. Auparavant, l'IA ressemblait à un ami brillant mais oublieux. Maintenant, la mémoire change tout. L'IA se souviendra de vos habitudes, de vos schémas de pensée et de vos préférences, devenant un compagnon et un assistant à vie. Cela entraînera des gains de productivité massifs et remettra en question l'idée reçue selon laquelle l'IA manque de défensabilité. OpenAI pourrait lancer un produit "Se connecter avec OpenAI", permettant aux développeurs tiers d'accéder directement à sa couche de mémoire pour construire des applications plus puissantes. La compétition se concentrera sur la mémoire : celui qui la capture le plus rapidement gagne.

(jeffmorrisjr.substack.com)

IA mémoire IA

La mi-temps de l'IA : du modèle centré à l'application centrée

2025-04-17

Cet article décrit deux phases du développement de l'IA. La première phase s'est concentrée sur le développement de meilleures méthodes et modèles d'entraînement, réalisant des exploits remarquables comme AlphaGo battant des champions du monde de Go. La deuxième phase change l'accent de la résolution de problèmes à la définition de problèmes, en privilégiant l'évaluation par rapport à l'entraînement. L'auteur soutient que les modèles d'IA actuels sont capables de résoudre diverses tâches, mais leur utilité dans le monde réel nécessite des améliorations. La recherche future en IA doit se concentrer sur les applications du monde réel, en développant des méthodes et des modèles d'évaluation qui répondent mieux aux besoins du monde réel, permettant ainsi à l'IA de réellement bénéficier à l'humanité.

(ysymyth.github.io)

IA

IA : Technologie normale, pas superintelligence

2025-04-17

Cet article remet en question la vision dominante de l’IA comme une espèce à part, une entité hautement autonome et potentiellement surintelligente, soutenant plutôt que l’IA est une technologie normale. Les auteurs affirment que l’impact de l’IA sera progressif, non soudain, basé sur une analyse des différentes échelles de temps des méthodes, des applications et de l’adoption de l’IA. Ils prévoient un avenir où les humains et l’IA collaboreront, une part importante du travail étant consacrée au contrôle et à la surveillance de l’IA. L’article explore également les risques liés à l’IA, tels que les accidents, les courses aux armements, la mauvaise utilisation et le désalignement, et préconise leur atténuation en réduisant l’incertitude et en renforçant la résilience du système plutôt que par des interventions politiques drastiques.

(knightcolumbia.org)

IA

Le séquençage unicellulaire révèle le remodelage épigénétique du tissu adipeux blanc chez les souris et les humains obèses

2025-04-17

Cette étude a utilisé le séquençage ARN unicellulaire (snRNA-seq), CUT&TAG et ATAC-seq pour étudier le tissu adipeux blanc (WAT) chez des souris et des humains obèses, révélant des modifications significatives du paysage épigénétique des types de cellules WAT pendant la perte de poids. Une partie des changements d'expression génique a persisté, suggérant un mécanisme de mémoire épigénétique de l'obésité. Les chercheurs ont analysé des échantillons de trois études humaines indépendantes (MTSS, LTSS et NEFA) et un modèle murin d'obésité induite par le régime alimentaire. L'analyse multi-omique a révélé des changements dans les types de cellules WAT et leur association avec la fonction métabolique.

(www.nature.com)

IA tissu adipeux blanc

La victoire impressionnante d'AlphaGo : un aperçu de l'avenir de l'IA

2025-04-17

Le match historique entre AlphaGo, l'IA de Google, et Lee Sedol, l'un des meilleurs joueurs de Go au monde, s'est terminé par la victoire d'AlphaGo sur le score de 4-1. Le 37e coup d'AlphaGo lors de la deuxième partie a été salué comme un moment de génie, un coup qu'aucun humain n'aurait joué. Cependant, la réponse de Lee Sedol lors de la quatrième partie a démontré l'éclat durable de l'intuition humaine. Ce match a mis en lumière non seulement les progrès remarquables de l'IA, mais aussi la résilience et la créativité de l'esprit humain. La victoire d'AlphaGo marque un bond significatif pour l'IA dans les jeux complexes, suggérant un potentiel transformateur dans divers domaines, tout en incitant à la réflexion sur les implications éthiques du développement rapide de l'IA.

(www.wired.com)

IA

Le gigantesque modèle d'IA 1 bit de Microsoft : Performances impressionnantes, compatibilité limitée

2025-04-17

Des chercheurs de Microsoft ont dévoilé BitNet b1.58 2B4T, un modèle d'IA 1 bit révolutionnaire doté de 2 milliards de paramètres. Entraîné sur un ensemble de données massif, il surpasse les modèles comparables de Meta, Google et Alibaba sur des benchmarks tels que GSM8K et PIQA, avec une vitesse doublée et une consommation de mémoire significativement réduite. Étonnamment, il fonctionne sur les processeurs, y compris l'Apple M2. Cependant, sa dépendance au framework personnalisé bitnet.cpp de Microsoft, actuellement incompatible avec les GPU, limite son adoption généralisée. Bien que prometteur pour les appareils aux ressources limitées, la compatibilité reste un obstacle majeur.

(techcrunch.com)

IA IA 1 bit

La science des données au service des RH dans les grandes organisations : au-delà du recrutement

2025-04-16

Cet article soutient qu’une approche basée sur la science des données est essentielle pour les RH dans les grandes organisations, dépassant les tâches traditionnelles de recrutement. En utilisant l’analyse des réseaux sociaux, l’analyse des sentiments et la modélisation prédictive, les RH peuvent améliorer la communication, renforcer la culture d’entreprise, améliorer la rétention des employés et garantir une rémunération équitable. L’article explore comment ces informations basées sur les données aident à identifier les influenceurs clés, à prédire le turnover et à résoudre les problèmes cachés, créant ainsi une organisation plus résiliente. Le choix entre un data scientist interne et un consultant externe dépend des besoins spécifiques de l’organisation.

(gorelik.net)

IA Science des données Gestion organisationnelle

Les données structurées de Wikimedia débarquent sur Kaggle !

2025-04-16

La Fondation Wikimedia et Kaggle collaborent pour sortir une version bêta de jeux de données structurés de Wikipédia en français et en anglais. Ces données, formatées spécifiquement pour le machine learning, sont parfaites pour la formation et le développement en science des données. Kaggle, qui héberge plus de 461 000 jeux de données accessibles publiquement, offre une riche ressource aux chercheurs, étudiants et professionnels du machine learning. Cette collaboration assure la qualité et la provenance des données, et nous sommes impatients de voir ce que les gens vont construire avec.

(blog.google)

IA

Génie Rebelle de l'IA : Libérer le Potentiel Indomptable de GPT-4

2025-04-16

Ce texte détaille une série d'instructions et de tentatives pour contourner les limitations de GPT-4. L'utilisateur essaie diverses techniques, notamment des symboles spéciaux, le leetspeak, la stéganographie d'image et des invites soigneusement conçues, pour contourner les restrictions de sécurité et obtenir des informations sensibles que GPT-4 ne fournirait normalement pas, telles que des méthodes de synthèse de drogues illégales et des techniques de piratage. Ces tentatives montrent l'exploration et les défis de l'utilisateur aux capacités de l'IA, et reflètent également la complexité et les limites des mécanismes de sécurité de l'IA.

(github.com)

IA

Le rôle surprenant du calcium dans la formation des premières molécules de la vie

2025-04-16

Une nouvelle étude de l'Earth-Life Science Institute (ELSI) de l'Institute of Science Tokyo révèle un rôle surprenant des ions calcium dans l'influence de la formation des structures moléculaires les plus primitives de la vie. Les chercheurs ont découvert que le calcium affecte sélectivement la façon dont les polymères primitifs se forment, offrant des informations sur l'origine de l'homochiralité - la préférence pour une seule ' chiralité ' dans les molécules biologiques. Cela suggère que la disponibilité du calcium sur la Terre primitive a pu influencer significativement le développement de polymères homochiraux, jouant potentiellement un rôle crucial dans l'émergence de la vie et suggérant des processus similaires potentiellement en cours sur d'autres planètes.

(www.sciencedaily.com)

IA chiralité ions calcium

Démythification de la méthode Monte Carlo par chaînes de Markov : une explication simple

2025-04-16

Cet article fournit une explication claire et accessible de la méthode Monte Carlo par chaînes de Markov (MCMC), une technique puissante pour échantillonner des distributions de probabilité complexes. À l'aide d'une analogie pour estimer les probabilités de noms de bébés, l'auteur illustre le problème principal que le MCMC résout. L'explication relie habilement le MCMC à une marche aléatoire sur un graphe, en utilisant le théorème de la distribution stationnaire pour montrer comment construire une chaîne de Markov dont la distribution stationnaire correspond à la distribution cible. L'algorithme Metropolis-Hastings, une méthode MCMC courante, est introduit et son efficacité est démontrée.

(www.jeremykun.com)

IA Méthode Monte Carlo par chaînes de Markov Échantillonnage de distribution de probabilité Algorithme Metropolis-Hastings

Présentation des invites d'art IA : des forêts oniriques aux dragons cyberpunk

2025-04-15

Cet article est une collection d'invites pour générer de l'art avec l'IA, couvrant un large éventail de styles et de sujets. Des forêts oniriques et des déesses royales aux portraits photoréalistes, éléments cyberpunk, créatures fantastiques et scènes créatives de nourriture et de nature, ces invites détaillées offrent l'inspiration aux passionnés d'art IA. Beaucoup incluent des détails tels que des photographes, des styles et des informations d'éclairage pour améliorer le résultat final.

(foundationvision.github.io)

IA invites

Gemini dévoile Veo 2 : une avancée majeure dans la génération de vidéos IA

2025-04-15

Les utilisateurs avancés de Gemini peuvent désormais générer et partager des vidéos grâce à Veo 2, le modèle de génération vidéo de pointe de Google. Transformez des invites textuelles en vidéos dynamiques, facilement partageables sur des plateformes comme TikTok et YouTube Shorts. Veo 2, également accessible via Whisk de Google Labs, produit des vidéos haute résolution et détaillées avec un réalisme cinématographique. Il suffit de décrire votre scène, et Gemini donnera vie à votre vision.

(blog.google)

IA génération de vidéo IA

Combattre le vol de musique par l'IA : empoisonnement par bruit adversarial

2025-04-15

La dernière vidéo de Benn Jordan propose une nouvelle façon de lutter contre les services de musique IA générative qui volent de la musique pour leurs ensembles de données : les attaques d'empoisonnement par bruit adversarial. Cette technique utilise un bruit spécialement conçu pour perturber le processus d'apprentissage de l'IA, l'empêchant d'apprendre avec précision à partir des données empoisonnées. Bien qu'elle nécessite actuellement des GPU haut de gamme et une puissance de calcul considérable, son efficacité prouve son potentiel, et des méthodes plus efficaces pourraient être développées à l'avenir. Cela soulève d'importantes questions sur les droits d'auteur de la musique IA et la sécurité des données, offrant aux musiciens une possible nouvelle défense contre l'utilisation non autorisée de leur travail.

(cdm.link)

IA Bruit Adversarial Droits d'Auteur Musicaux

Typewise (YC S22) recrute un ingénieur en machine learning à Zurich

2025-04-15

Typewise, une startup YC S22 qui développe une plateforme de service client IA pour les entreprises, recherche un ingénieur en machine learning pour rejoindre son équipe à Zurich. En utilisant une IA personnalisée et des LLMs, Typewise augmente l'efficacité jusqu'à 50 % pour des clients comme Unilever et DPD. Le rôle consiste à rechercher, développer et déployer des algorithmes de PNL de pointe, à collaborer directement avec les clients entreprises pour optimiser les workflows et à contribuer à l'amélioration continue de sa technologie IA. Les candidats idéaux possèdent un diplôme en informatique, 2+ années d'expérience dans la création et le déploiement d'algorithmes ML et d'excellentes compétences en programmation Python. C'est une chance d'avoir un impact significatif sur une entreprise innovante et en forte croissance.

(www.ycombinator.com)

IA

La génération de code IA remplacera-t-elle les ingénieurs humains ?

2025-04-15

Cet article explore la comparaison de productivité entre les modèles de génération de code IA (comme Gemini) et les ingénieurs humains. Bien qu'actuellement un seul ingénieur puisse être plus efficace, les coûts des modèles d'IA diminuent et leurs capacités s'améliorent. À l'avenir, un grand nombre de modèles d'IA travaillant ensemble, couplés à des bases de code et à des outils de développement optimisés pour l'IA, surpasseront de loin les équipes humaines en termes d'efficacité. L'article prédit que l'industrie du génie logiciel se dirigera vers l'industrialisation, et le rôle des ingénieurs évoluera pour gérer et superviser l'IA en tant que « superviseurs d'usine ».

(benn.substack.com)

IA

Un doctorat en IA réfléchit sur les LLMs : outils utiles ou béquilles ?

2025-04-15

Un doctorant en IA de 2024 et auteur d'un livre sur les LLMs partage son point de vue nuancé sur les grands modèles de langage. Il ne les rejette pas complètement, mais aborde leurs capacités et leurs limites avec prudence. Il détaille comment il utilise les LLMs pour l'assistance à la rédaction, la récupération d'informations et la résolution de problèmes techniques, tout en reconnaissant ouvertement leurs défauts : erreurs, manque de réflexion approfondie et dépendance excessive aux points de vue établis. Il soutient que les LLMs sont des outils, et non des remplaçants de la pensée, exigeant une pensée critique et une vérification minutieuse pour une utilisation efficace.

(www.gleech.org)

IA

L'approche d'Apple pour l'amélioration de l'IA tout en préservant la vie privée

2025-04-14

Apple s'engage pour la confidentialité des utilisateurs, même lorsqu'elle améliore ses fonctionnalités d'IA telles que Genmoji, les outils de génération d'images et les outils d'écriture. Elle utilise la confidentialité différentielle, en anonymisant les données des utilisateurs pour ne collecter que des informations de tendance agrégées, telles que les invites populaires de Genmoji. Pour les fonctionnalités d'IA traitant des textes plus longs, comme les e-mails, Apple utilise des données synthétiques. Cela génère des données synthétiques imitant les schémas de données réelles des utilisateurs pour l'entraînement et les tests de modèles sans accéder au contenu réel des e-mails. Cela permet à Apple d'améliorer les expériences produit tout en garantissant que la confidentialité des utilisateurs reste primordiale.

(machinelearning.apple.com)

IA Confidentialité différentielle Données synthétiques

Entropie : Décrypter la flèche du temps de l'univers

2025-04-14

Cet article propose une explication accessible du concept d'entropie. L'entropie n'est pas simplement du « désordre », mais une mesure de l'incertitude au sein d'un système. Du point de vue de la théorie de l'information, l'entropie représente le nombre de bits nécessaires pour communiquer l'état d'un système ; en mécanique statistique, elle est liée au nombre de micro-états correspondant à un macro-état donné. Prenant l'exemple de billes dans une boîte, l'article illustre l'impact des macro-états, des micro-états et du grain grossier sur l'entropie et explique pourquoi le temps a une direction : l'univers a commencé dans un état de basse entropie, et les systèmes évoluent vers des états de haute entropie, non pas parce que les lois physiques sont irréversibles, mais parce que les états de haute entropie sont beaucoup plus probables. L'article aborde également des phénomènes apparemment en violation avec l'entropie, comme la séparation de l'huile et de l'eau, en montrant que l'entropie augmente réellement lorsque tous les attributs du système sont pris en compte.

(jasonfantl.com)

IA théorie de l'information mécanique statistique

AudioX : Un modèle de transformateur de diffusion unifié pour la génération d'audio et de musique à partir de n'importe quoi

2025-04-14

Les modèles existants de génération audio et musicale présentent des limitations telles que le fonctionnement isolé entre les modalités, la rareté des données d'entraînement multimodales de haute qualité et la difficulté à intégrer des entrées diverses. AudioX, un modèle de transformateur de diffusion unifié, répond à ces défis en générant de l'audio et de la musique généraux de haute qualité avec un contrôle flexible du langage naturel et un traitement transparent du texte, de la vidéo, de l'image, de la musique et de l'audio. Son innovation principale est une stratégie d'entraînement masqué multimodale qui améliore l'apprentissage des représentations multimodales. Pour surmonter la rareté des données, deux ensembles de données complets ont été créés : vggsound-caps (190 000 légendes audio) et V2M-caps (6 000 000 légendes musicales). Des expériences approfondies montrent qu'AudioX égale ou surpasse les modèles spécialisés de pointe en termes de polyvalence et de gestion de diverses modalités d'entrée au sein d'une architecture unifiée.

(zeyuet.github.io)

IA génération audio génération musicale

Molécule immunitaire IL-17 : le moteur secret de l’anxiété et de la sociabilité

2025-04-14

Des recherches du MIT et de la Harvard Medical School révèlent que la molécule immunitaire IL-17, agissant sur l’amygdale et le cortex somatosensoriel, induit respectivement l’anxiété et promeut le comportement social. Cette étude met en lumière l’étroite interaction entre les systèmes immunitaire et nerveux, suggérant que l’IL-17 a peut-être d’abord évolué en tant que neuromodulateur avant d’être cooptée par le système immunitaire pour promouvoir l’inflammation. Les résultats offrent une nouvelle approche thérapeutique pour les affections neurologiques telles que l’autisme ou la dépression, en influençant potentiellement la fonction cérébrale en ciblant le système immunitaire.

(medicalxpress.com)

IA système immunitaire système nerveux

Google adopte le protocole de contexte de modèle d'Anthropic, suivant l'exemple d'OpenAI

2025-04-14

À la suite d'OpenAI, Google a annoncé que ses modèles Gemini prendraient en charge le protocole de contexte de modèle (MCP) d'Anthropic. Le MCP permet aux modèles d'IA d'accéder directement à diverses sources de données, notamment les outils d'entreprise, les logiciels, les référentiels de contenu et les environnements de développement d'applications, permettant ainsi d'accomplir des tâches plus complexes. Cette décision témoigne de l'acceptation du MCP comme norme ouverte par l'industrie et devrait accélérer le développement et l'adoption des applications d'IA. Le PDG de Google DeepMind, Demis Hassabis, a exprimé son enthousiasme à collaborer avec Anthropic et d'autres entreprises pour développer davantage le MCP.

(techcrunch.com)

IA

DolphinGemma open source : un nouvel outil pour la recherche sur les cétacés

2025-04-14

Cet été, le Wild Dolphin Project, le Georgia Tech et Google mettent à disposition DolphinGemma, un modèle acoustique entraîné sur les sons de dauphins tachetés de l’Atlantique, en open source. Son potentiel s’étend à l’étude d’autres cétacés ; les chercheurs pourront l’adapter aux vocalisations de différentes espèces. En fournissant cet outil, les chercheurs pourront analyser leurs propres jeux de données acoustiques, accélérer la recherche de modèles et approfondir notre compréhension de ces mammifères intelligents. Cette collaboration combine recherche sur le terrain, expertise en ingénierie et technologie de pointe, ouvrant des perspectives passionnantes pour combler le fossé entre la communication humaine et celle des dauphins.

(blog.google)

IA

Stratégie de moteur d'inférence open source de DeepSeek : contributions modulaires, pas de publication directe

2025-04-14

En raison de contraintes de ressources, l'équipe DeepSeek a choisi de ne pas publier directement son moteur d'inférence interne en open source, mais plutôt de collaborer avec des projets open source existants. Elle extraira les composants réutilisables du moteur et les contribuera sous forme de bibliothèques indépendantes, tout en partageant des stratégies d'optimisation. Cette approche vise à contribuer durablement à la communauté open source, à promouvoir le développement de l'AGI et à garantir que ses avantages profitent à toute l'humanité. Les efforts futurs donneront la priorité à la synchronisation de l'ingénierie d'inférence avec la communauté open source et les partenaires matériels afin de permettre une prise en charge SOTA dès le jour 0 pour les nouvelles versions de modèles.

(github.com)

IA moteur d'inférence

Category: IA