OpenAIのo3システム、ARC-AGIベンチマークで画期的なスコア達成
2024-12-20
OpenAIの新しいo3システムは、ARC-AGI-1公開トレーニングセットでトレーニングされ、セミプライベート評価セットで75.7%という画期的なスコアを達成しました。これは、大規模言語モデルの以前の限界を超えるものであり、AI能力の飛躍的な向上を示しています。GPTファミリーではこれまで見られなかった新しいタスクへの適応能力を実証しました。真の汎用人工知能(AGI)には至っていませんが、o3の成功は、テスト時の知識の再結合の重要性を強調し、継続的なAGI研究のための貴重なデータポイントを提供します。o3は依然として一部の簡単なタスクで失敗しており、真のAGI達成の複雑さを示しています。
AI