Transformer² : les LLMs auto-adaptatifs révolutionnent le domaine

2025-01-15
Transformer² : les LLMs auto-adaptatifs révolutionnent le domaine

Transformer² est un nouveau système d'apprentissage automatique qui ajuste dynamiquement ses poids pour diverses tâches. Inspiré par les mécanismes adaptatifs de la nature, comme un poulpe changeant de couleur ou le cerveau se reconfigurant, il permet aux grands modèles de langage (LLMs) de s'adapter à de nouvelles tâches en temps réel. Utilisant la décomposition en valeurs singulières (SVD) et l'apprentissage par renforcement (RL), Transformer² décompose les poids du modèle en composants indépendants et apprend à les combiner de manière optimale pour diverses tâches, notamment les mathématiques, le codage, le raisonnement et la compréhension visuelle. Les résultats montrent que Transformer² surpasse les approches statiques traditionnelles comme LoRA en termes d'efficacité et de performances spécifiques à la tâche, nécessitant beaucoup moins de paramètres. Ce travail ouvre la voie à la construction de systèmes d'IA « intelligence vivante » qui apprennent et évoluent continuellement.

Lire plus

Automatisation de la recherche de vie artificielle avec des modèles fondamentaux

2024-12-24
Automatisation de la recherche de vie artificielle avec des modèles fondamentaux

Sakana AI, en collaboration avec le MIT et d'autres institutions, a développé ASAL, un algorithme utilisant des modèles fondamentaux de vision-langage pour automatiser la découverte de la vie artificielle. ASAL s'attaque à trois problèmes de recherche : trouver des simulations présentant des comportements cibles spécifiques, découvrir des simulations générant une nouveauté perpétuelle et éclairer toutes les simulations possibles. Appliqué avec succès à Lenia, Boids, Particle Life, et d'autres, ASAL a mis au jour de nouvelles formes de vie artificielle et des règles d'automates cellulaires surpassant le Jeu de la vie de Conway en termes d'ouverture. Cette percée promet de revitaliser la recherche sur la vie artificielle en surmontant les limites de la conception manuelle des simulations et offre des perspectives pour le développement futur de l'IA, intégrant les principes d'ouverture et d'auto-organisation.

Lire plus