L'IA conquiert Pokémon Rouge : Le triomphe d'un petit agent RL

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

L'IA conquiert Pokémon Rouge : Le triomphe d'un petit agent RL

2025-03-05

Une équipe a réussi à battre le jeu Pokémon Rouge de 1996 en utilisant l'apprentissage par renforcement (RL) avec une politique contenant moins de 10 millions de paramètres, soit plus de 60 000 fois moins que DeepSeekV3. Le projet est open source et s'appuie sur des outils d'ingénierie inverse de Pokémon et des émulateurs de jeux existants. L'équipe a choisi RL pour son efficacité de collecte de données, éliminant le besoin de grands ensembles de données pré-entraînés. Cela représente une percée de l'IA dans la conquête de jeux complexes, établissant une nouvelle référence pour le RL dans des environnements plus difficiles.

(drubinstein.github.io)

Probabilités du Loto : Une Valeur Attendue Positive Rare ?

Apple conteste l'ordre du gouvernement britannique de casser le chiffrement d'iCloud