IA Conquista Pokémon Rojo: El Triunfo de un Pequeño Agente de RL

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

IA Conquista Pokémon Rojo: El Triunfo de un Pequeño Agente de RL

2025-03-05

Un equipo venció con éxito al juego Pokémon Rojo de 1996 usando aprendizaje por refuerzo (RL) con una política que contiene menos de 10 millones de parámetros, más de 60,000 veces menor que DeepSeekV3. El proyecto es de código abierto y aprovecha herramientas de ingeniería inversa de Pokémon y emuladores de juegos existentes. El equipo eligió RL por su eficiente recolección de datos, eliminando la necesidad de grandes conjuntos de datos preentrenados. Esto representa un gran avance en la IA al conquistar juegos complejos, estableciendo un nuevo punto de referencia para RL en entornos más desafiantes.

(drubinstein.github.io)

Probabilidades de Lotería: ¿Un Valor Esperado Positivo Raro?

Apple desafía la orden del gobierno del Reino Unido para romper el cifrado de iCloud