Adversarielle Strategien schlagen übermenschliche Go-KIs

2024-12-24
Adversarielle Strategien schlagen übermenschliche Go-KIs

Forscher erzielten eine Gewinnrate von über 97 % gegen das hochmoderne Go-KI-System KataGo, indem sie adversarielle Strategien trainierten. Diese Gegner gewannen nicht durch gutes Go-Spiel, sondern indem sie KataGo zu kritischen Fehlern verleiteten. Der Angriff übertrug sich ohne erneutes Training auf andere übermenschliche Go-KIs und war einfach genug, damit menschliche Experten ihn ohne algorithmische Unterstützung reproduzieren konnten. Die Schwachstelle blieb bestehen, selbst nachdem KataGo adversariell trainiert wurde, um sich dagegen zu verteidigen, was überraschende Fehlermodi selbst in übermenschlichen KI-Systemen aufzeigt.