IA Conquista Pokémon Rojo: El Triunfo de un Pequeño Agente de RL

2025-03-05

Un equipo venció con éxito al juego Pokémon Rojo de 1996 usando aprendizaje por refuerzo (RL) con una política que contiene menos de 10 millones de parámetros, más de 60,000 veces menor que DeepSeekV3. El proyecto es de código abierto y aprovecha herramientas de ingeniería inversa de Pokémon y emuladores de juegos existentes. El equipo eligió RL por su eficiente recolección de datos, eliminando la necesidad de grandes conjuntos de datos preentrenados. Esto representa un gran avance en la IA al conquistar juegos complejos, estableciendo un nuevo punto de referencia para RL en entornos más desafiantes.

IA