敵対的ポリシーが超人的な囲碁AIを打ち負かす

2024-12-24

研究者たちは、最先端の囲碁AIであるKataGoに対して敵対的ポリシーを訓練することで、97%を超える勝率を達成しました。これらの敵対者は、囲碁をうまくプレイすることではなく、KataGoに重大なミスを犯させることで勝利しました。この攻撃は、他の超人的な囲碁AIにもゼロショットで転移し、人間のエキスパートがアルゴリズムの助けなしに再現できるほどシンプルでした。この脆弱性は、KataGoが敵対的に訓練されて防御された後も存続し、超人的なAIシステムでさえ驚くべき失敗モードを持つことを示しています。