KI bezwingt Pokémon Rot: Der Triumph eines kleinen RL-Agenten

2025-03-05

Ein Team hat erfolgreich das 1996er Spiel Pokémon Rot mit Reinforcement Learning (RL) besiegt, wobei eine Policy mit weniger als 10 Millionen Parametern verwendet wurde – über 60.000 Mal kleiner als DeepSeekV3. Das Projekt ist Open Source und nutzt bestehende Pokémon Reverse-Engineering-Tools und Spielemulierer. Das Team entschied sich für RL aufgrund der effizienten Datenerfassung, wodurch der Bedarf an großen vortrainierten Datensätzen entfällt. Dies stellt einen Durchbruch der KI bei der Bewältigung komplexer Spiele dar und setzt einen neuen Maßstab für RL in anspruchsvolleren Umgebungen.

KI