Adversarielle Strategien schlagen übermenschliche Go-KIs

Beliebte Tags：

Kosmos Virtualisierung DNS-Sicherheit formale Verifikation Erreichbarkeitsanalyse KI Compilerfehler Makrokonflikt Web-Erweiterung Entwicklungsframework Alle Tags

Adversarielle Strategien schlagen übermenschliche Go-KIs

2024-12-24

Forscher erzielten eine Gewinnrate von über 97 % gegen das hochmoderne Go-KI-System KataGo, indem sie adversarielle Strategien trainierten. Diese Gegner gewannen nicht durch gutes Go-Spiel, sondern indem sie KataGo zu kritischen Fehlern verleiteten. Der Angriff übertrug sich ohne erneutes Training auf andere übermenschliche Go-KIs und war einfach genug, damit menschliche Experten ihn ohne algorithmische Unterstützung reproduzieren konnten. Die Schwachstelle blieb bestehen, selbst nachdem KataGo adversariell trainiert wurde, um sich dagegen zu verteidigen, was überraschende Fehlermodi selbst in übermenschlichen KI-Systemen aufzeigt.

(arxiv.org)

KI adversarielle Strategien KI-Schwachstellen Go-KI

KI-generierte Bug-Reports überschwemmen Open-Source-Projekte

Chilenischer Vulkanausbruch enthüllt tausendjährige Unterwasserlandschaft