DeepSeekのR1-Zero：人間の介入なしでAGIへ？

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

DeepSeekのR1-Zero：人間の介入なしでAGIへ？

2025-01-29

DeepSeekは、推論システムR1-ZeroとR1を発表しました。ARC-AGI-1ベンチマークで、OpenAIのo1システムと同等のスコア（15～20％）を達成し、LLMの単純なスケーリングに依存するGPT-4oの5％を大幅に上回りました。R1-Zeroは特に注目に値し、教師ありファインチューニング（SFT）を必要とせず、強化学習のみに依存しています。R1-Zeroは可読性や言語の混在に課題を抱えているものの、数学やコーディング分野では優れた性能を示し、SFTなしで正確な思考連鎖推論が可能であることを実証しました。これはAGI研究に新たな道を切り開き、将来的には人間の注釈なしでAGIを訓練できる可能性を示唆しています。

(arcprize.org)

技術コミュニケーション協会（STC）が破産申請

オラクルのJava価格変更が大量離脱を引き起こす