DeepCoder-14B:OpenAIのo3-miniに匹敵するオープンソースのコード推論モデル
2025-04-09
AgenticaとTogether AIは、Deepseek-R1-Distilled-Qwen-14Bから分散型強化学習によって微調整されたコード推論モデル、DeepCoder-14B-Previewをリリースしました。LiveCodeBenchで60.6%のPass@1精度を達成し、わずか14BパラメータでOpenAIのo3-miniに匹敵する性能を示しています。このプロジェクトでは、データセット、コード、トレーニングログ、システム最適化をオープンソース化しており、高品質なデータとGRPOへのアルゴリズム改良に基づいた堅牢なトレーニングレシピを示しています。この進歩により、高性能なコード生成モデルへのアクセスが民主化されます。
AI
コード推論