DeepSeek-Prover-V2:強化学習による定理証明の革新
2025-04-30
DeepSeek-Prover-V2は、Lean 4における形式的定理証明のために設計されたオープンソースの大規模言語モデルです。DeepSeek-V3による再帰的定理証明パイプラインと強化学習を活用して、非公式と公式の数学的推論を統合しています。このモデルは、DeepSeek-V3を使用して複雑な問題を部分目標に分解し、これらの部分目標の証明を合成して、強化学習の初期データを作成することから始めます。DeepSeek-Prover-V2-671Bは、MiniF2F-testで88.9%の合格率を達成し、PutnamBenchから49の問題を解決しました。また、高校の競技会や教科書から325の形式化された問題を含む新しいベンチマークデータセット、ProverBenchも導入されました。
AI
定理証明