Le goulot d'étranglement de l'exploration dans les LLM : la prochaine frontière de la collecte d'expériences

2025-07-07

Le succès des grands modèles de langage (LLM) repose sur un pré-entraînement massif sur de grandes quantités de données textuelles, une ressource qui finira par s'épuiser. L'avenir de l'IA évoluera vers une « ère de l'expérience », où la collecte efficace du bon type d'expérience bénéfique pour l'apprentissage sera cruciale, plutôt que de simplement empiler des paramètres. Cet article explore comment le pré-entraînement résout implicitement une partie du problème de l'exploration et comment une meilleure exploration conduit à une meilleure généralisation. L'auteur propose que l'exploration se compose de deux axes : « échantillonnage du monde » (choix des environnements d'apprentissage) et « échantillonnage de trajectoire » (collecte de données au sein des environnements). La future mise à l'échelle de l'IA doit optimiser la densité d'information sur ces deux axes, en allouant efficacement les ressources de calcul au lieu de simplement rechercher l'échelle des paramètres ou le volume des données.

Lire plus

ChatGPT a menti, alors nous avons créé une fonctionnalité

2025-07-07

Le scanner de partitions de Soundslice a commencé à recevoir de nombreux journaux d'erreurs : des captures d'écran de sessions ChatGPT où les utilisateurs essayaient de télécharger des tablatures de guitare ASCII. Le rebondissement ? ChatGPT affirmait à tort que Soundslice le prenait en charge ! Pour gérer l'afflux de nouveaux utilisateurs induits en erreur par cette désinformation, Soundslice a créé un importateur de tablatures ASCII, une fonctionnalité très éloignée de sa feuille de route 2025. Cela soulève la question : les entreprises devraient-elles développer des fonctionnalités en réponse à la désinformation générée par l'IA ?

Lire plus

Livre Springer sur l'apprentissage automatique accusé de citations fabriquées

2025-07-07
Livre Springer sur l'apprentissage automatique accusé de citations fabriquées

Un manuel d'apprentissage automatique à 169 $, "Mastering Machine Learning", publié par Springer Nature, a été accusé de contenir de nombreuses citations fabriquées. Une enquête a révélé que les deux tiers des 18 citations vérifiées n'existaient pas ou contenaient des erreurs significatives. Plusieurs chercheurs cités ont confirmé que les travaux étaient faux ou que les citations contenaient des inexactitudes substantielles. Cela soulève des inquiétudes quant à la fiabilité du contenu généré par les grands modèles de langage (LLM) et à la réglementation des outils d'IA dans l'édition universitaire. L'éditeur enquête, mais l'incident souligne les défis à l'intégrité académique posés par l'écriture assistée par IA.

Lire plus

ISEVIC : Redonnez vie à votre C64

2025-07-07
ISEVIC : Redonnez vie à votre C64

ISEVIC est un cœur FPGA qui permet à votre Commodore 64 vintage de sortir de la vidéo numérique via HDMI ! Il fonctionne en lisant les signaux du bus sur le port de la cartouche et en les traduisant en une image affichable. Il prend en charge plusieurs plates-formes FPGA, y compris le Tang Nano 20K. Le projet inclut des fichiers Gerber et des bitstreams pour une carte porteuse de slot de cartouche C64, avec détection automatique PAL/NTSC. Bien que la plupart des cartouches fonctionnent, certaines (comme l'EasyFlash 3) peuvent avoir des problèmes de compatibilité. Une émulation expérimentale du SID pour le son est également incluse. Prêt à revivre les classiques ?

Lire plus
Matériel

Améliorer la précision de l'imprimante 3D Prusa Core One : Un guide complet

2025-07-07

Cet article fournit un guide centré sur l'utilisateur pour améliorer la précision et l'utilité de l'imprimante 3D Prusa Core One. Il couvre l'alignement du plateau d'impression, l'alignement de l'axe Core XY, la tension de la courroie et une configuration de caméra personnalisée avec des instructions détaillées et des illustrations. L'auteur partage également divers projets d'impression 3D, notamment des formes géométriques assemblées magnétiquement et des outils pratiques, ainsi que des recommandations de logiciels et de ressources open source.

Lire plus

Tests Choquants sur la Décoloration des Marqueurs

2025-07-07
Tests Choquants sur la Décoloration des Marqueurs

Un test de six mois a révélé des problèmes choquants de résistance à la lumière avec les marqueurs. Les marqueurs à base d'alcool, y compris des marques coûteuses comme Copic et Winsor & Newton, se sont décolorés de manière significative, certaines couleurs disparaissant complètement. Les marqueurs à base d'eau n'ont pas fait beaucoup mieux, montrant une décoloration considérable. Cependant, certains marqueurs résistants à la lumière, tels que les Faber-Castell Pitt Artist Pens, les Winsor & Newton Watercolour Markers et les Talens Pantone, ont eu de meilleures performances, mais ont quand même montré une décoloration. Pour préserver les œuvres d'art réalisées avec des marqueurs, il est recommandé de les numériser, de les photographier ou de les encadrer avec du verre anti-UV, en particulier pour les tons roses et néons qui ont été les plus mauvais.

Lire plus

Résolution de Wordle avec uv et les paquets Python

2025-07-07

L'auteur avait précédemment écrit un solveur de Sudoku utilisant le résolveur de dépendances de Poetry et tente maintenant de résoudre Wordle en utilisant uv, plus avancé. L'article détaille comment traduire le problème de Wordle en un problème de dépendances de paquets Python, utilisant intelligemment le résolveur de dépendances d'uv pour trouver la solution. En créant une série de paquets représentant les positions des lettres et les retours, et en définissant des dépendances entre eux, l'auteur résout Wordle avec succès en utilisant uv.

Lire plus
Développement

Microjax : JAX en deux classes et six fonctions

2025-07-07
Microjax : JAX en deux classes et six fonctions

Inspiré par Micrograd d'Andrej Karpathy, Microjax est une bibliothèque qui reproduit les fonctionnalités de JAX en utilisant seulement deux classes et six fonctions. Contrairement au populaire PyTorch, Microjax adopte le style de programmation plus fonctionnel de JAX. Ce tutoriel s'inspire largement de l'excellente présentation de Matthew J Johnson de 2017 sur autograd, le prédécesseur de JAX, en le simplifiant et en le proposant sous forme de notebook.

Lire plus
Développement

Mes données Pocket ont révélé mes secrets

2025-07-07
Mes données Pocket ont révélé mes secrets

Avant la fermeture de Pocket, l'auteur a exporté près de 900 articles enregistrés sur sept ans et a utilisé l'outil d'IA o3 pour les analyser. Étonnamment, o3 a déduit avec précision l'âge, le sexe, la localisation, la profession, le revenu, la situation familiale de l'auteur, et même ses orientations politiques, sa tolérance au risque et son style d'apprentissage. Cela a suscité des réflexions sur la confidentialité des données et les capacités de l'IA, inspirant la création d'un système de recommandation de contenu personnalisé.

Lire plus
IA

arXivLabs : Expérimenter avec la collaboration communautaire

2025-07-07
arXivLabs : Expérimenter avec la collaboration communautaire

arXivLabs est un cadre permettant de développer et de partager de nouvelles fonctionnalités arXiv directement sur le site web, de manière collaborative. Les participants doivent adhérer aux valeurs d'arXiv : ouverture, communauté, excellence et confidentialité des données utilisateur. Vous avez une idée pour améliorer la communauté arXiv ? En savoir plus sur arXivLabs !

Lire plus
Développement

Figma : outil de collaboration ou tueur de créativité ?

2025-07-07
Figma : outil de collaboration ou tueur de créativité ?

Cet article revient sur l’évolution de Figma au cours d’une décennie, passant des éloges initiaux pour son innovation aux inquiétudes concernant son approche excessivement technique. L’auteur soutient que des fonctionnalités telles que la mise en page automatique et le mode développeur, bien qu’augmentant l’efficacité, étouffent la liberté et la créativité des designers lors des premières phases d’exploration, conduisant à une homogénéisation du design. L’auteur exhorte les designers à être vigilants face à ce changement, en prônant la flexibilité dans le processus de conception, en donnant la priorité à l’exploration et à l’expérimentation initiales plutôt qu’à une structure et une cohérence prématurées.

Lire plus

Un paradoxe quantique ébranle les fondements de la physique

2025-07-07
Un paradoxe quantique ébranle les fondements de la physique

Une nouvelle expérience de pensée remet en question les fondements de la mécanique quantique. L'expérience, impliquant quatre agents et des mesures quantiques complexes, conduit à des résultats contradictoires : deux observateurs arrivent à des conclusions opposées sur le même événement. Cela suggère qu'au moins l'une des trois hypothèses fondamentales est fausse : la mécanique quantique est universelle ; les mesures ont des résultats uniques ; et les prédictions quantiques de différents observateurs ne sont pas contradictoires. L'expérience oblige à une réévaluation des interprétations quantiques, telles que l'interprétation des nombreux mondes et les théories de l'effondrement spontané, suggérant potentiellement une nouvelle compréhension de la réalité.

Lire plus

Le Pari Indien sur les Batteries de Véhicules Électriques : Indépendance ou Dépendance ?

2025-07-07
Le Pari Indien sur les Batteries de Véhicules Électriques : Indépendance ou Dépendance ?

L'Inde s'apprête à produire en masse des batteries pour véhicules électriques d'ici 18 mois, mais la structure de l'industrie soulève des inquiétudes. Les principaux fabricants de batteries, Amara Raja et Exide, détiennent un nombre de brevets nettement inférieur à celui des géants chinois et sud-coréens, soulignant une dépendance de longue date à la technologie étrangère. De nombreuses entreprises indiennes optent pour des collaborations, s'appuyant sur la technologie et les chaînes d'approvisionnement étrangères plutôt que sur la R&D indépendante. Si certaines entreprises comme Ola Electric et Godi India tentent d'innover de manière indépendante, la quasi-faillite de Log9 Materials souligne les risques. Le succès de l'Inde dépend non seulement de la production de batteries, mais aussi de la maîtrise de la technologie sous-jacente. Sans un changement radical de cette dépendance aux idées importées, ses ambitions pourraient simplement remplacer d'anciennes dépendances par de nouvelles.

Lire plus

Les marchands de viande pour chats dans le Londres victorien : un portrait de dur labeur

2025-07-07
Les marchands de viande pour chats dans le Londres victorien : un portrait de dur labeur

Pendant le règne de la reine Victoria, les marchands de viande pour chats de Londres, avec leurs tabliers bleus, leurs chapeaux noirs et leurs pantalons en velours côtelé, sont devenus un sujet d'investigation anthropologique pour les journalistes. *London Labour and the London Poor* (1851), de Henry Mayhew, explore leur monde visible mais mystérieux. Mayhew a estimé qu'il y avait mille de ces commerçants desservant environ 300 000 chats. Bien que cela semble lucratif, les interviews de Mayhew ont révélé une vie de travail épuisant. Un marchand a rapporté avoir marché de 30 à 40 miles par jour dans les rues de Londres.

Lire plus

Claude d'Anthropic : Usage équitable contre piratage dans l'entraînement de l'IA

2025-07-07
Claude d'Anthropic : Usage équitable contre piratage dans l'entraînement de l'IA

Anthropic, lors de l'entraînement de son chatbot IA Claude, a "numérisé de manière destructive" des millions de livres protégés par le droit d'auteur et en a téléchargé des millions de copies piratées. Un juge a statué que l'utilisation de livres achetés à des fins d'entraînement constituait un usage équitable, mais que l'utilisation de livres piratés constituait une violation du droit d'auteur. Cette affaire, une décision historique concernant les données d'entraînement de l'IA, met en lumière le débat en cours sur l'approvisionnement éthique des données d'entraînement pour les grands modèles de langage.

Lire plus

Un hymne millénaire à Babylone redécouvert

2025-07-07
Un hymne millénaire à Babylone redécouvert

Des chercheurs de la LMU de Munich, en collaboration avec l'Université de Bagdad, ont redécouvert et déchiffré un hymne millénaire à Babylone à l'aide de l'IA. L'hymne, inscrit sur une tablette d'argile, décrit avec vivacité la grandeur de l'ancienne ville et la vie de ses habitants, offrant des perspectives sans précédent sur la société babylonienne, en particulier les rôles des femmes en tant que prêtresses. La découverte a impliqué la numérisation de milliers de tablettes cunéiformes et l'utilisation de l'IA pour identifier les fragments connexes, non seulement en restaurant l'hymne mais aussi en révélant sa popularité généralisée à l'époque.

Lire plus
Technologie Civilisation Antique

Permis d'émission atmosphérique du centre de données xAI à Memphis : réglementations plus strictes, préoccupations persistantes

2025-07-07
Permis d'émission atmosphérique du centre de données xAI à Memphis : réglementations plus strictes, préoccupations persistantes

xAI a obtenu un permis d'émission atmosphérique pour son centre de données de Memphis, exigeant des enregistrements détaillés des démarrages, des arrêts, des dysfonctionnements et des événements de réglage, avec des rapports semestriels au département de la santé. Le permis limite les heures de fonctionnement des turbines et le nombre de démarrages/arrêts, imposant des limites strictes aux émissions visibles pour atténuer la pollution de l'air. Le Southern Environmental Law Center (SELC) continuera de surveiller les opérations de xAI, exprimant des préoccupations concernant la source d'énergie d'un deuxième centre de données prévu et la transparence générale.

Lire plus
Technologie

Deno 2.4 : Compilation, importations améliorées et fonctionnalités stables

2025-07-07
Deno 2.4 : Compilation, importations améliorées et fonctionnalités stables

Deno 2.4 arrive avec des mises à jour passionnantes ! La commande `deno bundle`, de retour, permet de créer des bundles JavaScript en un seul fichier, en utilisant esbuild pour le tree-shaking et la minification. Le nouveau drapeau `--unstable-raw-imports` permet l’importation directe de données texte et binaires, simplifiant l’importation de fichiers autres que JavaScript. La prise en charge intégrée d’OpenTelemetry est désormais stable, supprimant le besoin du drapeau `--unstable-otel`. De plus, un nouveau drapeau `--preload` vous permet d’exécuter du code avant votre script principal, la commande `deno update` simplifie la gestion des dépendances, et `deno run --coverage` collecte désormais la couverture des sous-processus. La gestion des permissions est améliorée avec la prise en charge des caractères génériques de sous-domaine et des plages CIDR. La prise en charge de `package.json` est améliorée, incluant une meilleure gestion des exportations conditionnelles et des paquets npm locaux.

Lire plus
Développement

Des milliers de nouvelles étoiles binaires eclipsantes découvertes par des citoyens scientifiques

2025-07-07
Des milliers de nouvelles étoiles binaires eclipsantes découvertes par des citoyens scientifiques

La NASA a annoncé que des citoyens scientifiques, participant au projet Eclipsing Binary Patrol, ont découvert des milliers de systèmes d'étoiles binaires eclipsantes jusqu'alors inconnus grâce aux données du satellite TESS (Transiting Exoplanet Survey Satellite) de la NASA. Ces systèmes, composés de deux étoiles en orbite l'une autour de l'autre et s'éclipsant périodiquement, sont essentiels à l'étude de la formation et de l'évolution des étoiles et pourraient contribuer à la recherche d'exoplanètes. Le projet, combinant apprentissage automatique et vérification humaine, démontre l'immense potentiel de la collaboration homme-machine dans la recherche astronomique.

Lire plus
Technologie binaires eclipsantes

Face-à-face des formats Tar : lequel est le meilleur ?

2025-07-07

Cet article explore un test complet de compatibilité de différents formats tar (v7, ustar, pax, GNU, etc.). Les résultats montrent que le format POSIX ustar offre la meilleure compatibilité, tandis que le format GNU excelle pour les longs chemins d'accès et les fichiers volumineux. Le format pax, bien que riche en fonctionnalités, souffre d'une faible compatibilité. L'auteur recommande de privilégier le format ustar, d'utiliser le format GNU pour les longs chemins d'accès et les fichiers volumineux si nécessaire, et de faire preuve de prudence avec les fonctionnalités étendues du format pax pour assurer une compatibilité maximale.

Lire plus

Navigation interstellaire : New Horizons utilise la parallaxe stellaire

2025-07-07
Navigation interstellaire : New Horizons utilise la parallaxe stellaire

Le vaisseau spatial New Horizons de la NASA, qui s'éloigne de notre système solaire, offre un point de vue unique sur la Voie lactée. Les positions des étoiles apparaissent significativement différentes de celles observées depuis la Terre. Les scientifiques ont tiré parti de cet effet de parallaxe pour réaliser la première navigation interstellaire utilisant les positions des étoiles. En comparant les images de Proxima Centauri et de Wolf 359 prises par New Horizons avec les données du télescope spatial Gaia, les chercheurs ont calculé la position de la sonde dans la galaxie. Bien que moins précise que le Deep Space Network, cette méthode offre des avantages à de plus grandes distances de la Terre, permettant un fonctionnement autonome sans dépendre des signaux radio de notre système solaire. De futures améliorations pourraient améliorer considérablement la précision, ouvrant la voie à de futures missions interstellaires.

Lire plus

La police du Maine s'excuse pour une photo de preuve modifiée par IA

2025-07-07
La police du Maine s'excuse pour une photo de preuve modifiée par IA

Le département de police de Westbrook, dans le Maine, a présenté ses excuses pour avoir partagé sur Facebook une photo de preuves de drogue modifiée par IA. Un agent a utilisé une application d'édition de photos pour ajouter l'écusson du département, modifiant involontairement les détails de l'image. La police a initialement nié avoir utilisé l'IA, puis l'a admis et a publié une comparaison côte à côte des photos originale et modifiée. L'incident souligne les défis posés par l'IA pour garantir l'authenticité des preuves.

Lire plus

La FSF assiégée : des attaques DDoS incessantes menacent le logiciel libre

2025-07-07

L'équipe système de la Free Software Foundation (FSF) subit des attaques par déni de service distribué (DDoS) incessantes, provenant de sources incluant des robots d'exploration web de grands modèles de langage (LLM) et d'entités inconnues. Ces attaques ont perturbé à plusieurs reprises des services critiques tels que gnu.org et Savannah. Malgré une petite équipe et des ressources limitées, la FSF se bat. L'article encourage les lecteurs à devenir membres associés pour soutenir les efforts de la FSF dans la défense du logiciel libre et de la liberté des utilisateurs contre ces menaces persistantes.

Lire plus
Technologie

Isomorphic Labs : Des médicaments conçus par IA prêts pour les essais sur l'homme

2025-07-07
Isomorphic Labs : Des médicaments conçus par IA prêts pour les essais sur l'homme

Isomorphic Labs, la branche secrète de découverte de médicaments d'Alphabet, s'apprête à lancer des essais cliniques sur l'homme pour ses médicaments conçus par IA. En exploitant la technologie AlphaFold de DeepMind, l'entreprise peut prédire avec précision les structures protéiques et modéliser leurs interactions, accélérant ainsi considérablement le développement de médicaments. Isomorphic Labs s'est associée à des géants pharmaceutiques tels que Novartis et Eli Lilly, obtenant 600 millions de dollars de financement pour construire un moteur de conception de médicaments de classe mondiale. Son objectif est d'améliorer considérablement le taux de réussite de la découverte de médicaments, en visant un avenir où la conception de médicaments serait aussi simple que de cliquer sur un bouton.

Lire plus
Technologie

L'essor du concepteur de puces full-stack : une révolution impulsée par l'IA ?

2025-07-07
L'essor du concepteur de puces full-stack : une révolution impulsée par l'IA ?

Cet article explore comment l'IA pourrait révolutionner la conception de puces en permettant une approche « full-stack ». Traditionnellement, les équipes front-end (conception RTL) et back-end (génération GDS) travaillent de manière isolée, ce qui entraîne des inefficacités. L'auteur soutient que l'IA, en particulier les LLM, peut combler ce manque en créant des bases de données de connaissances, en améliorant la génération de RTL et en améliorant la documentation. Cela réduira les cycles d'itération, permettant à des individus ou à de petites équipes de gérer l'ensemble du flux de conception de puces. Cette efficacité accrue est cruciale pour faire face à la hausse des coûts de fabrication et des outils EDA, et deviendra un avantage concurrentiel clé pour les entreprises de conception de puces.

Lire plus
Développement conception de puces

Développement d'aventures textuelles : équilibre entre portée et détails

2025-07-07

Développer des jeux d'aventure textuels nécessite une gestion minutieuse de la portée. L'auteur relate trois tentatives, en commençant par des objectifs trop ambitieux et en réduisant progressivement l'échelle jusqu'à finalement terminer un jeu. L'article explore les dimensions de « ampleur » et de « détails » dans la conception de jeux d'aventure textuels et les compromis entre eux. L'auteur compare Lockout, axé sur les détails, à The Plot of the Phantom, axé sur l'ampleur, en analysant les avantages et les inconvénients de chaque style. Les joueurs modernes ont tendance à préférer des expériences détaillées. L'auteur conclut en discutant du coût et du temps de développement des jeux d'aventure textuels et de la façon dont la gestion de la portée est cruciale pour créer un jeu amusant.

Lire plus

Calendriers de l'AGI : IA pour les impôts en 2028 ? Apprentissage en cours de travail en 2032 ?

2025-07-07
Calendriers de l'AGI : IA pour les impôts en 2028 ? Apprentissage en cours de travail en 2032 ?

L'animateur de podcast Dwarkesh discute des calendriers de l'AGI (Intelligence Artificielle Générale). Il soutient que, bien que les LLM actuels soient impressionnants, leur manque d'apprentissage continu limite sévèrement leurs applications dans le monde réel. Il utilise l'analogie de l'apprentissage du saxophone pour illustrer comment les LLM apprennent différemment des humains, incapables d'accumuler de l'expérience et d'améliorer leurs compétences comme le font les humains. Cela le conduit à être prudent quant aux percées de l'AGI dans les prochaines années, mais optimiste quant au potentiel des décennies à venir. Il prédit 2028 pour que l'IA gère les impôts aussi efficacement qu'un gestionnaire humain (y compris la recherche de reçus et de factures) et 2032 pour que l'IA soit capable d'apprentissage en cours de travail aussi parfaitement qu'un humain. Il pense qu'une fois l'apprentissage continu résolu, l'AGI mènera à un saut massif, potentiellement résultant en quelque chose de semblable à une explosion d'intelligence.

Lire plus

Classiques de Windows modernisés : Gestionnaire de fichiers et Gestionnaire de programmes

2025-07-07
Classiques de Windows modernisés : Gestionnaire de fichiers et Gestionnaire de programmes

Envie de revivre l'expérience classique de Windows 95 ? C'est désormais possible grâce à Heirloom File Manager et Heirloom Program Manager ! Heirloom File Manager est une version modernisée du gestionnaire de fichiers classique de Windows, avec prise en charge de la haute résolution d'écran (DPI), une corbeille, des signets, la fonction glisser-déposer et la création/extraction d'archives zip. Heirloom Program Manager remplace le menu Démarrer et offre un raccourci pour lancer des programmes. Les deux applications sont gratuites et open source, vous offrant un voyage nostalgique vers l'âge d'or de Windows.

Lire plus
Divers

Astuces Python inhabituelles dans les bibliothèques courantes

2025-07-07
Astuces Python inhabituelles dans les bibliothèques courantes

Cet article dévoile des techniques Python moins connues découvertes en explorant des bibliothèques largement utilisées. L'auteur met en lumière l'utilisation de `super()` dans les classes de base pour une héritage multiple coopératif, l'emploi de mixins pour l'ajout modulaire de fonctionnalités, l'utilisation d'importations relatives pour des recherches spécifiques de paquets et l'utilisation de `__init__.py` au-delà de la déclaration de paquet pour la simplification de l'API et l'initialisation. L'article révèle également le rôle de `conftest.py` dans la reconnaissance des modules pytest et la valeur de l'étude des articles de conception de bibliothèques pour une compréhension plus approfondie.

Lire plus
Développement

systemd-lsp : Optimisez l'édition de vos fichiers d'unité systemd

2025-07-07
systemd-lsp : Optimisez l'édition de vos fichiers d'unité systemd

Fatigué de vous battre avec les fichiers d'unité systemd ? systemd-lsp change la donne. Cette implémentation du Protocole de serveur de langage (LSP) basée sur Rust fournit la mise en évidence de la syntaxe, les diagnostics, la saisie semi-automatique, la documentation au survol et la mise en forme pour vos fichiers d'unité systemd. Construit avec Rust pour la vitesse et la sécurité, c'est un seul binaire autonome avec une documentation intégrée, compatible avec tous les principaux éditeurs compatibles LSP sous Linux, macOS et Windows. L'installation est simple grâce à Cargo. Essayez-le dès aujourd'hui !

Lire plus
Développement
1 2 123 124 125 127 129 130 131 595 596