DeepSeek-Prover-V2：強化学習による定理証明の革新

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

2025-04-30

DeepSeek-Prover-V2は、Lean 4における形式的定理証明のために設計されたオープンソースの大規模言語モデルです。DeepSeek-V3による再帰的定理証明パイプラインと強化学習を活用して、非公式と公式の数学的推論を統合しています。このモデルは、DeepSeek-V3を使用して複雑な問題を部分目標に分解し、これらの部分目標の証明を合成して、強化学習の初期データを作成することから始めます。DeepSeek-Prover-V2-671Bは、MiniF2F-testで88.9％の合格率を達成し、PutnamBenchから49の問題を解決しました。また、高校の競技会や教科書から325の形式化された問題を含む新しいベンチマークデータセット、ProverBenchも導入されました。