DeepSeekのR1-Zero:人間の介入なしでAGIへ?

2025-01-29
DeepSeekのR1-Zero:人間の介入なしでAGIへ?

DeepSeekは、推論システムR1-ZeroとR1を発表しました。ARC-AGI-1ベンチマークで、OpenAIのo1システムと同等のスコア(15~20%)を達成し、LLMの単純なスケーリングに依存するGPT-4oの5%を大幅に上回りました。R1-Zeroは特に注目に値し、教師ありファインチューニング(SFT)を必要とせず、強化学習のみに依存しています。R1-Zeroは可読性や言語の混在に課題を抱えているものの、数学やコーディング分野では優れた性能を示し、SFTなしで正確な思考連鎖推論が可能であることを実証しました。これはAGI研究に新たな道を切り開き、将来的には人間の注釈なしでAGIを訓練できる可能性を示唆しています。

AI