L'IA conquiert Pokémon Rouge : Le triomphe d'un petit agent RL

2025-03-05

Une équipe a réussi à battre le jeu Pokémon Rouge de 1996 en utilisant l'apprentissage par renforcement (RL) avec une politique contenant moins de 10 millions de paramètres, soit plus de 60 000 fois moins que DeepSeekV3. Le projet est open source et s'appuie sur des outils d'ingénierie inverse de Pokémon et des émulateurs de jeux existants. L'équipe a choisi RL pour son efficacité de collecte de données, éliminant le besoin de grands ensembles de données pré-entraînés. Cela représente une percée de l'IA dans la conquête de jeux complexes, établissant une nouvelle référence pour le RL dans des environnements plus difficiles.

IA