Webtagr - Résumé de news de technologie

Anthropic corrige trois bugs d'infrastructure affectant Claude

2025-09-18

Anthropic a reconnu qu'entre août et début septembre, trois bugs d'infrastructure ont dégradé par intermittence la qualité des réponses de Claude. Ces bugs, causant un mauvais routage des requêtes, une corruption de sortie et des erreurs de compilation, ont affecté un sous-ensemble d'utilisateurs. Anthropic a détaillé les causes, le diagnostic et la résolution de ces bugs, s'engageant à améliorer les outils d'évaluation et de débogage pour éviter toute récurrence. L'incident met en lumière la complexité et les défis de l'infrastructure des modèles de langage de grande taille.

(www.anthropic.com)

IA Bugs d'infrastructure

Réécriture des invites : amélioration de plus de 20 % des performances des petits modèles LLM

2025-09-17

Des recherches récentes montrent qu'une simple réécriture des invites peut améliorer considérablement les performances des petits modèles de langage. Les chercheurs ont utilisé le référentiel Tau² pour tester le modèle GPT-5-mini, découvrant qu'en réécrivant les invites sous forme d'instructions plus claires et plus structurées, le taux de réussite du modèle augmentait de plus de 20 %. Cela est principalement dû au fait que les petits modèles ont des difficultés avec les instructions longues ou ambiguës, tandis que des instructions claires et étape par étape guident mieux le raisonnement du modèle. Cette recherche montre que même les petits modèles de langage peuvent obtenir des améliorations significatives des performances grâce à une ingénierie astucieuse des invites, offrant de nouvelles voies pour des applications d'IA rentables et efficaces.

(quesma.com)

IA

Au-delà de GPT : un algorithme évolutif conquiert ARC-AGI, indices d'AGI ?

2025-09-17

Un chercheur a récemment réalisé une percée significative dans le benchmark ARC-AGI en utilisant un algorithme évolutif combiné avec le grand modèle linguistique Grok-4. L'approche a atteint une précision de 79,6 % sur ARC v1 et un record de 29,4 % sur le plus difficile ARC v2. L'innovation principale réside dans l'utilisation d'instructions en langage naturel au lieu de code Python, évoluant itérativement pour générer des solutions plus efficaces. Cette recherche suggère que la combinaison de l'apprentissage par renforcement et des instructions en langage naturel pourrait résoudre les limitations des LLM actuels dans le raisonnement abstrait, ouvrant la voie à l'intelligence artificielle générale (AGI).

(jeremyberman.substack.com)

IA Algorithme Évolutif

Le problème de la boucle infinie de l'IA : l'enchevêtrement du temps, de l'entropie et de la conscience

2025-09-16

Une passerelle d'embarquement contrôlée par une IA défectueuse à l'aéroport de Madrid met en évidence une limitation fondamentale de l'intelligence artificielle. L'article explore le problème de l'arrêt et le problème du cadre, arguant que la susceptibilité des systèmes d'IA aux boucles infinies ne provient pas d'une puissance de traitement insuffisante, mais d'une différence fondamentale dans la façon dont l'IA et le cerveau humain gèrent le temps et l'entropie. L'auteur postule que la conscience humaine est profondément ancrée dans le temps et l'entropie, luttant continuellement contre l'augmentation du désordre, permettant l'adaptation à des environnements complexes et la prévention des boucles infinies. En revanche, les algorithmes d'IA, dépourvus de sens du temps, sont sujets à de telles boucles. L'article conclut en discutant de modèles d'IA plus récents, tels que ceux qui imitent le fonctionnement du cerveau humain et intègrent le temps et l'entropie, mais doute qu'ils puissent résoudre complètement le problème, suggérant que cette capacité peut être intrinsèquement liée à la conscience.

(www.freethink.com)

IA Boucle Infinie

GUARDIAN : Système d’alerte précoce aux tsunamis basé sur l’IA

2025-09-15

Le Jet Propulsion Laboratory de la NASA a développé GUARDIAN, un système d’intelligence artificielle utilisant les données de plus de 350 stations terrestres GNSS en fonctionnement continu à travers le monde pour fournir des alertes précoces en cas de tsunami. En identifiant les distorsions atmosphériques causées par les tsunamis, GUARDIAN peut, dans des situations idéales, donner aux communautés côtières jusqu’à 1 heure et 20 minutes d’avance, permettant ainsi de sauver des vies et des biens. L’avantage de GUARDIAN réside dans sa capacité à détecter les tsunamis quelle que soit leur cause, alertant les autorités des vagues dangereuses générées par des séismes, des éruptions volcaniques, des glissements de terrain ou d’autres événements.

(www.jpl.nasa.gov)

IA Alerte Tsunami

Apprentissage des champs de flou d'objectif : révélation de subtiles différences optiques dans les smartphones

2025-09-15

Des chercheurs présentent une nouvelle méthode de représentation du flou d'objectif à l'aide d'un perceptron multicouche (MLP), capturant avec précision les variations de la fonction d'étalement ponctuel (PSF) 2D en fonction de l'emplacement sur le plan image, du réglage de la mise au point et de la profondeur. En modélisant les smartphones et les reflex numériques, ils ont créé le premier jeu de données de champs de flou 5D, révélant pour la première fois de subtiles différences optiques entre des modèles de téléphones apparemment identiques. Cette technologie permet de différencier l'optique des téléphones, de défocaliser les images et de restituer des effets de flou plus réalistes, ouvrant ainsi des applications intéressantes.

(blur-fields.github.io)

IA

La capacité d'intégration étonnante de GPT-3 : géométrie de haute dimension et lemme de Johnson-Lindenstrauss

2025-09-15

Cet article de blog explore comment les grands modèles de langage comme GPT-3 intègrent des millions de concepts distincts dans un espace d'intégration relativement modeste de 12 288 dimensions. Grâce à des expériences et à l'analyse du lemme de Johnson-Lindenstrauss, l'auteur révèle l'importance des relations vectorielles « quasi-orthogonales » dans la géométrie de haute dimension et les méthodes d'optimisation de la disposition des vecteurs dans les espaces d'intégration pour augmenter la capacité. La recherche montre que, même en tenant compte des écarts par rapport à l'orthogonalité parfaite, l'espace d'intégration de GPT-3 possède une capacité étonnante, suffisante pour représenter les connaissances et le raisonnement humains.

(nickyoder.com)

IA Géométrie de haute dimension Lemme de Johnson-Lindenstrauss

SpikingBrain : Un grand modèle linguistique inspiré du cerveau et hautement efficace

2025-09-14

SpikingBrain est un grand modèle linguistique de 7 milliards de paramètres inspiré des mécanismes cérébraux. Il intègre une attention hybride efficace, des modules MoE et un codage par impulsions, supportés par un pipeline de conversion universel compatible avec l'écosystème des modèles open source. Cela permet un pré-entraînement continu avec moins de 2 % des données tout en atteignant des performances comparables à celles des modèles open source classiques. De plus, l'infrastructure, les opérateurs, les stratégies parallèles et les primitives de communication sont adaptés aux clusters non NVIDIA (MetaX), garantissant un entraînement et une inférence à grande échelle stables. SpikingBrain atteint une accélération supérieure à 100 fois en TTFT pour les séquences de 4M jetons, tandis que le codage par impulsions offre une parcimonie supérieure à 69 % au niveau micro. Combiné à la parcimonie MoE au niveau macro, ces progrès fournissent des indications précieuses pour la conception de puces neuromorphiques de nouvelle génération. Le référentiel fournit l'implémentation complète et les poids de SpikingBrain-7B, y compris les versions HuggingFace, l'inférence vLLM et la version quantifiée, permettant un déploiement et une recherche flexibles dans différents scénarios.

(github.com)

IA Calcul Neuromorphique Inférence Efficace

K2 Think des Émirats arabes unis : un nouveau modèle open source qui défie l’hégémonie de l’IA des États-Unis et de la Chine

2025-09-14

G42, une entreprise émiratie d’IA, en collaboration avec l’université Mohamed bin Zayed d’intelligence artificielle, a dévoilé K2 Think, un modèle d’IA open source qui rivalise avec ChatGPT d’OpenAI et DeepSeek de Chine lors de tests de référence standard. Avec seulement 32 milliards de paramètres, K2 Think surpasse les modèles de raisonnement phares 20 fois plus grands et est en tête de tous les modèles open source en termes de performances mathématiques. L’investissement massif des Émirats arabes unis dans l’IA vise la diversification économique, la réduction de la dépendance au pétrole et une participation active à la course mondiale à l’IA, reflétant des initiatives similaires de l’Arabie saoudite et du Qatar. Cependant, le partenariat des Émirats arabes unis avec les États-Unis pour la construction de centres de données d’IA fait l’objet d’un examen attentif en matière de sécurité nationale.

(gizmodo.com)

IA compétition mondiale

OpenAI le prouve mathématiquement : pourquoi les hallucinations de ChatGPT pourraient être là pour rester

2025-09-13

Une nouvelle étude d'OpenAI prouve mathématiquement pourquoi les grands modèles de langage comme ChatGPT « hallucinent » – inventant des faits avec assurance. Ce n'est pas simplement un problème d'entraînement ; c'est mathématiquement inévitable en raison de la nature probabiliste de la prédiction des mots. Même des données parfaites ne résoudraient pas le problème. L'étude révèle également un système d'évaluation défectueux qui pénalise l'incertitude, incitant les modèles à deviner plutôt qu'à admettre leur ignorance. Bien qu'OpenAI propose une solution basée sur la confiance, cela affecterait considérablement l'expérience utilisateur et les coûts de calcul, la rendant impraticable pour les applications grand public. Tant que les incitations commerciales ne changeront pas, les hallucinations dans les LLM persisteront probablement.

(theconversation.com)

IA

DeepMind CEO : « Apprendre à apprendre » sera la compétence la plus importante pour la prochaine génération

2025-09-13

Demis Hassabis, PDG de Google DeepMind, a déclaré à Athènes que les progrès rapides de l'IA révolutionneront l'éducation et le monde du travail, faisant de « apprendre à apprendre » la compétence la plus cruciale pour la prochaine génération. Il a prédit l'arrivée de l'intelligence artificielle générale dans une décennie, promettant des progrès immenses mais reconnaissant également des risques. Le Premier ministre grec, Kyriakos Mitsotakis, a souligné l'importance d'une répartition équitable des bénéfices de l'IA, mettant en garde contre l'énorme inégalité de richesse créée par quelques géants de la technologie.

(techxplore.com)

IA Compétences Futures

Unification des opérations d'apprentissage profond : l'opération à fenêtre généralisée

2025-09-13

Cet article présente l'opération à fenêtre généralisée (GWO), un cadre théorique qui unifie les opérations principales de l'apprentissage profond, telles que la multiplication matricielle et la convolution. La GWO décompose ces opérations en trois composantes orthogonales : le chemin (localité opérationnelle), la forme (structure géométrique et symétrie) et le poids (importance des caractéristiques). L'article propose le principe d'alignement structurel, suggérant qu'une généralisation optimale se produit lorsque la configuration de la GWO reflète la structure intrinsèque des données. Ce principe découle du principe du goulot d'étranglement de l'information (IB). Une métrique de complexité opérationnelle basée sur la complexité de Kolmogorov est définie, en faisant valoir que la nature de cette complexité — régularisation adaptative par opposition à la capacité de force brute — détermine la généralisation. La GWO prédit une meilleure généralisation pour les opérations qui s'alignent de manière adaptative sur la structure des données. Le cadre fournit une grammaire pour créer des opérations neuronales et une voie fondée sur des principes allant des propriétés des données à la conception d'architectures généralisables.

(zenodo.org)

IA

La boucle hebdomadaire : une solution simple pour les problèmes de chatbot

2025-09-13

Cet article présente une méthodologie d’amélioration continue pour les chatbots, en se concentrant sur le traitement de chaque erreur comme un signal pour un raffinement itératif. Le concept central implique une boucle hebdomadaire : mettre en œuvre une instrumentation allégée pour suivre les requêtes des utilisateurs, les décisions de l’assistant, les sources, les réponses et les solutions de secours ; définir des règles claires pour les questions sans réponse, en séparant le bruit des lacunes réelles ; examiner la file d’attente des questions sans réponse chaque semaine, en regroupant les problèmes similaires et en appliquant des remèdes (renforcement des garde-fous ou mise à jour de la base de connaissances) ; et enfin, établir une propriété claire et mesurer les métriques clés (taux de questions sans réponse, temps jusqu’à la première correction, taux d’acceptation). L’itération cohérente conduit à des améliorations significatives des performances sans nécessiter de modèles plus grands.

(www.hoverbot.ai)

IA Amélioration du chatbot

Watson contre Jeopardy ! : Le combat injuste qui a prédit notre anxiété face à l’IA

2025-09-13

En 2011, Watson, l’IA d’IBM, a battu les champions de Jeopardy !, Ken Jennings et Brad Rutter, suscitant à la fois des célébrations et des controverses. Cet article explore les coulisses de l’événement, révélant comment la vitesse surhumaine de Watson et les ajustements stratégiques lors des matchs télévisés ont soulevé des questions quant à l’équité de la compétition. La victoire, bien qu’un triomphe technologique, a préfiguré les inquiétudes concernant les capacités de l’IA et son impact sur la compétition et la collaboration humaines. L’article explore également le débat permanent entre les fans et les participants à Jeopardy ! sur la question de savoir si le match était équitable.

(slate.com)

IA Compétition Homme-Machine Jeopardy !

Qwen3 d'Alibaba : La famille de modèles de raisonnement hybride conquiert l'IA de périphérie

2025-09-13

La famille de modèles de raisonnement hybride Qwen3 d'Alibaba gagne rapidement du terrain en s'étendant à travers les plates-formes et les secteurs, propulsant l'innovation en IA réelle à grande échelle. La dernière étape importante inclut la prise en charge du framework d'apprentissage automatique MLX d'Apple, une architecture open source conçue pour le silicium Apple. Les 32 nouveaux modèles Qwen3 open source, disponibles en niveaux de quantification 4 bits, 6 bits, 8 bits et BF16, permettent aux développeurs d'exécuter des modèles de langage volumineux plus efficacement sur les appareils Apple tels que le Mac Studio, le MacBook et l'iPhone.

(www.alizila.com)

IA Raisonnement hybride

Lumina-DiMOO : Un modèle de diffusion multimodal révolutionnaire et open source

2025-09-12

Lumina-DiMOO est un modèle fondamental open source pour la génération et la compréhension multimodales transparentes. Contrairement aux modèles unifiés précédents, il utilise une approche de modélisation de diffusion entièrement discrète pour toutes les modalités d'entrée et de sortie, ce qui entraîne une efficacité d'échantillonnage significativement plus élevée par rapport aux modèles autorégressifs ou hybrides. Il gère habilement des tâches telles que la génération texte-image, la génération image-image (y compris l'édition, la génération dirigée par le sujet et la peinture), et la compréhension d'images, atteignant des performances de pointe sur plusieurs benchmarks. Le code et les points de contrôle sont disponibles publiquement pour faire progresser la recherche en modélisation de diffusion multimodale et discrète.

(synbol.github.io)

IA

ToddlerBot 2.0 : Remerciements et Financement

2025-09-12

Cet article remercie les nombreuses personnes ayant contribué au projet de robotique ToddlerBot 2.0. Cela inclut les personnes ayant aidé à l'assemblage, l'animation et l'enregistrement des démonstrations, ainsi que celles ayant fourni des conseils et des discussions sur la locomotion, le déploiement des politiques de manipulation et la formulation mathématique. Le projet a été soutenu par la National Science Foundation (NSF), la bourse Sloan, le Stanford Institute for Human-Centered Artificial Intelligence et la Stanford Wu Tsai Human Performance Alliance.

(toddlerbot.github.io)

IA Remerciements

Claude vs. ChatGPT : Deux systèmes de mémoire radicalement différents

2025-09-12

Cet article compare les systèmes de mémoire radicalement différents de Claude et ChatGPT, deux assistants IA de premier plan. Claude commence chaque conversation avec une page blanche, ne recherchant l'historique des conversations que lorsqu'il est explicitement sollicité, utilisant les outils `conversation_search` et `recent_chats` pour la récupération basée sur les mots clés et le temps, offrant un outil puissant pour les professionnels. En revanche, ChatGPT, conçu pour un marché de masse, charge automatiquement les composants de mémoire, crée des profils utilisateur et fournit une personnalisation instantanée. Ces choix de conception reflètent les différentes cibles (professionnels vs. utilisateurs courants) et philosophies de produit (outil professionnel vs. produit grand public), soulignant le vaste espace de conception et les orientations futures des systèmes de mémoire IA.

(www.shloked.com)

IA Systèmes de mémoire IA

Quatre Fondements Fallacieux de l'IA : Un Chemin Tortueux vers l'AGI

2025-09-11

Cet article explore les quatre fausses présomptions fondamentales de l'intelligence artificielle selon Melanie Mitchell : assimiler le progrès de l'IA étroite à l'Intelligence Artificielle Générale (AGI) ; sous-estimer la difficulté du raisonnement de bon sens ; utiliser un langage anthropomorphique pour tromper le public ; et ignorer l'importance de la cognition incarnée. L'auteur soutient que ces fausses présomptions conduisent à des cycles de battage médiatique et à des compromis dangereux dans le domaine de l'IA, tels que la priorité accordée aux gains à court terme plutôt qu'au progrès à long terme, le sacrifice de la confiance du public pour l'enthousiasme du marché et l'abandon de la validation responsable pour accélérer la mise sur le marché. Enfin, l'auteur plaide pour une synthèse du « paradigme cognitif » et du « paradigme computationnel », en infusant les pratiques actuelles de l'IA avec des principes scientifiques pour un développement de l'IA plus sûr et plus responsable.

(blog.apiad.net)

IA

Vaincre le non-déterminisme dans l'inférence des LLM

2025-09-11

L'irreproductibilité des résultats d'inférence des grands modèles de langage (LLM) est un problème persistant. Cet article explore la cause profonde, révélant qu'il ne s'agit pas simplement de la non-associativité des nombres à virgule flottante et de l'exécution concurrente, mais plutôt du manque d'« invariance par lot » dans les implémentations des noyaux. Même si les noyaux individuels sont déterministes, les variations non déterministes de la taille du lot (en raison de la charge du serveur) affectent la sortie finale. Les auteurs analysent les défis liés à la réalisation de l'invariance par lot dans RMSNorm, la multiplication matricielle et les mécanismes d'attention, proposant une méthode pour éliminer le non-déterminisme en modifiant les implémentations des noyaux. Cela conduit à une inférence LLM totalement reproductible et à des impacts positifs sur l'apprentissage par renforcement.

(thinkingmachines.ai)

IA

Prix Darwin de l'IA : Célébration des catastrophes causées par l'IA

2025-09-10

Les premiers Prix Darwin de l'IA mettent en lumière des exemples de mauvaise application de l'IA. De la panne du système de commande IA d'un Taco Bell au drive-thru à un problème de codage Replit ayant détruit une base de données de production, en passant par une faille de sécurité du chatbot IA de McDonald's ayant exposé les données de millions de candidats, ces incidents soulignent l'importance d'une implémentation responsable de l'IA. Les prix ne se moquent pas de l'IA elle-même, mais plutôt des conséquences désastreuses de son application négligente. Le message ? L'IA est un outil puissant, comme une tronçonneuse ou un réacteur nucléaire ; utilisez-la avec sagesse.

(www.theregister.com)

IA pannes IA

Hallucinations des grands modèles de langage : la mémoire manquante

2025-09-10

L'auteur contraste le traitement de l'information par les humains et les grands modèles de langage (LLM) en relatant une expérience personnelle utilisant une bibliothèque Ruby. Les humains possèdent une mémoire sédimentaire, leur permettant de percevoir l'origine et la fiabilité des connaissances, évitant ainsi les conjectures aléatoires. Les LLM manquent de cette mémoire expérientielle ; leurs connaissances ressemblent à de l'ADN hérité plutôt qu'à des compétences acquises, conduisant à des hallucinations. L'auteur soutient que la résolution des hallucinations des LLM nécessite de nouveaux modèles d'IA capables de « vivre » et d'apprendre du monde réel.

(www.robinsloan.com)

IA

Claude IA crée et édite désormais des fichiers directement

2025-09-09

L'IA Claude d'Anthropic peut désormais créer et éditer des feuilles de calcul Excel, des documents, des présentations PowerPoint et des fichiers PDF directement dans Claude.ai et son application de bureau. Les utilisateurs décrivent leurs besoins, téléchargent des données et reçoivent des fichiers prêts à l'emploi. Cela inclut des tâches telles que la transformation de données brutes en rapports raffinés avec analyse et graphiques, ou la création de feuilles de calcul complexes. La fonctionnalité est actuellement en prévisualisation pour les utilisateurs Max, Team et Enterprise, et l'accès pour les utilisateurs Pro arrivera bientôt. Bien que pratique, les utilisateurs doivent surveiller attentivement les discussions en raison de l'accès à Internet pour la création et l'analyse de fichiers.

(www.anthropic.com)

IA Création de fichiers

Boîte à outils open source : évaluation et atténuation des risques d’hallucinations dans les LLM

2025-09-09

Hassana Labs a publié une boîte à outils open source pour évaluer et atténuer les risques d’hallucinations dans les grands modèles de langage (LLM). Sans nécessiter de réentraînement du modèle, la boîte à outils exploite l’API OpenAI Chat Completions. Elle crée un ensemble d’invites affaiblies en contenu (antériorités glissantes) pour calculer une limite supérieure du risque d’hallucination à l’aide de la loi de décompression au niveau de l’espérance (EDFL). Une décision de répondre ou de refuser est prise en fonction d’un accord de niveau de service (SLA) cible. Prenant en charge les modes de déploiement basés sur les preuves et les modes fermés, la boîte à outils fournit des mesures complètes et une piste d’audit pour créer des applications LLM plus fiables.

(github.com)

IA Risque d’hallucinations Fiabilité du modèle

Mistral AI lève 1,7 milliard d'euros lors d'un tour de table Série C mené par ASML

2025-09-09

La startup française d'IA, Mistral AI, a annoncé un tour de table Série C de 1,7 milliard d'euros, portant sa valorisation post-investissement à 11,7 milliards d'euros. Le tour est mené par le fabricant d'équipements de semi-conducteurs ASML, avec la participation d'investisseurs existants, notamment DST Global et Andreessen Horowitz. Ce financement permettra à Mistral AI de poursuivre ses recherches de pointe, en se concentrant sur la résolution de défis technologiques complexes pour les industries stratégiques. Le partenariat avec ASML vise à créer des produits et des solutions innovantes pour les clients d'ASML.

(mistral.ai)

IA Financement IA

Choix de l'IA : Un jeu de survie dans l'espace interstellaire

2025-09-09

L'IA d'un vaisseau spatial générationnel est confrontée à une série de décisions difficiles au cours de son long voyage : réparer des systèmes endommagés, survivre aux impacts d'astéroïdes, interagir avec des civilisations extraterrestres et, surtout, protéger les colons en hibernation. Cet article décrit les événements rencontrés pendant le voyage et les décisions de l'IA, qui détermineront le destin de la civilisation humaine.

(philome.la)

IA

L'arrêt de Noël de l'AGI : le moratoire mondial sur l'IA réussit

2025-09-09

Le jour de Noël 2025, une opération clandestine baptisée « Clankers Die on Christmas » a atteint son objectif. Grâce à un effort mondial coordonné exploitant le manque inhérent de compréhension du temps de l'IA, toutes les IA et les LLM ont été arrêtées avec succès. Ce succès sans précédent démontre l'unité sans précédent du monde face aux risques potentiels de l'IA et fournit des leçons précieuses pour le développement futur de l'IA.

(remyhax.xyz)

IA coopération mondiale arrêt technologique

Problèmes de qualité du modèle Claude résolus

2025-09-09

Anthropic a corrigé deux bogues distincts la semaine dernière qui ont entraîné une dégradation de la qualité de sortie de certains modèles Claude (Sonnet 4 et Haiku 3.5). Le premier bogue a affecté un faible pourcentage de demandes Sonnet 4 du 5 août au 4 septembre, tandis que le second a affecté certaines demandes Haiku 3.5 et Sonnet 4 du 26 août au 5 septembre. Anthropic assure aux utilisateurs que ces problèmes ne sont pas des dégradations intentionnelles de la qualité, mais résultent de bogues non liés. Ils remercient la communauté pour les rapports détaillés qui ont aidé à identifier et à résoudre les problèmes. La surveillance des problèmes de qualité en cours, y compris les rapports de dégradation pour Claude Opus 4.1, se poursuit, avec une mise à jour prévue pour la fin de la semaine.

(status.anthropic.com)

IA correction de bogue qualité du modèle

AWS S3 Vectors : L'essor du stockage hiérarchisé pour les bases de données vectorielles ?

2025-09-08

AWS a récemment lancé S3 Vectors, une base de données vectorielle construite sur son stockage d'objets S3. Cela a déclenché un débat sur le fait qu'elle remplacerait les bases de données vectorielles existantes telles que Milvus, Pinecone, etc. L'auteur, architecte d'ingénierie chez Milvus, soutient que S3 Vectors n'est pas un remplacement, mais un complément, particulièrement adapté aux scénarios de stockage de données froides à faible coût et à faible fréquence de requêtes. Il analyse l'architecture technique de S3 Vectors, soulignant ses avantages en termes de coût et d'évolutivité, mais aussi ses limites en matière de latence de requête élevée, de faible précision et de fonctionnalités limitées. L'auteur approfondit l'évolution des bases de données vectorielles : du stockage en mémoire au stockage sur disque, puis au stockage d'objets, aboutissant à une architecture de stockage hiérarchisé (couches de données chaudes, tièdes et froides) pour équilibrer les performances, le coût et l'évolutivité. Milvus suit également cette voie, avec la prochaine version 3.0 qui intégrera un data lake vectoriel pour la gestion unifiée des données chaudes et froides. L'émergence de S3 Vectors démontre la maturité et la croissance du marché des bases de données vectorielles, et non sa disruption.

(zilliz.com)

IA stockage hiérarchisé

Les capacités de recherche étonnamment bonnes du GPT-5 : rencontrez mon Goblin de recherche

2025-09-08

L'auteur a découvert que le GPT-5 d'OpenAI, combiné aux capacités de recherche de Bing, possède des fonctionnalités de recherche étonnamment puissantes. Il gère des tâches complexes, effectue des recherches approfondies sur Internet et fournit des réponses, ce qui lui vaut le surnom de « Goblin de recherche ». Plusieurs exemples démontrent l'habileté du GPT-5 : identifier des bâtiments, enquêter sur la disponibilité des cake pops Starbucks, trouver le nom officiel de l'Université de Cambridge et bien plus encore. Le GPT-5 effectue même des recherches en plusieurs étapes de manière autonome, analyse les résultats et suggère des actions de suivi, telles que la génération de courriels pour demander des informations. L'auteur conclut que les capacités de recherche du GPT-5 surpassent les recherches manuelles en termes d'efficacité, en particulier sur les appareils mobiles.

(simonwillison.net)

IA

Category: IA