KI bezwingt Pokémon Rot: Der Triumph eines kleinen RL-Agenten

Beliebte Tags：

Kosmos Virtualisierung DNS-Sicherheit formale Verifikation Erreichbarkeitsanalyse KI Compilerfehler Makrokonflikt Web-Erweiterung Entwicklungsframework Alle Tags

KI bezwingt Pokémon Rot: Der Triumph eines kleinen RL-Agenten

2025-03-05

Ein Team hat erfolgreich das 1996er Spiel Pokémon Rot mit Reinforcement Learning (RL) besiegt, wobei eine Policy mit weniger als 10 Millionen Parametern verwendet wurde – über 60.000 Mal kleiner als DeepSeekV3. Das Projekt ist Open Source und nutzt bestehende Pokémon Reverse-Engineering-Tools und Spielemulierer. Das Team entschied sich für RL aufgrund der effizienten Datenerfassung, wodurch der Bedarf an großen vortrainierten Datensätzen entfällt. Dies stellt einen Durchbruch der KI bei der Bewältigung komplexer Spiele dar und setzt einen neuen Maßstab für RL in anspruchsvolleren Umgebungen.

(drubinstein.github.io)

Lotterie Wahrscheinlichkeit: Ein seltener positiv erwarteter Wert?

Apple widerspricht der Aufforderung der britischen Regierung, die iCloud-Verschlüsselung zu brechen