LLMが簡単なチェスプレイヤーに失敗:興味深いテスト
2025-01-26
著者は、アンダープロモーションと50手ルールを含む簡単なチェスプレイヤーを使って、様々な新しいLLMをテストしています。ガイダンスにもかかわらず、ほとんどのLLMはそれを解くことができず、論理的推論とドメイン固有の知識の限界を浮き彫りにしています。この迅速なテストはベンチマークとして機能し、LLMが専門的なトレーニングなしでチェスをマスターレベルでプレイできるようになるかどうかについての議論を促しています。パズルのシンプルさと、あまり一般的ではないテクニックへの焦点が、LLMの能力を洞察するのに役立っています。
AI