DeepCoder-14B: Open-Source Code-Reasoning-Modell erreicht Leistung von OpenAIs o3-mini

2025-04-09
DeepCoder-14B: Open-Source Code-Reasoning-Modell erreicht Leistung von OpenAIs o3-mini

Agentica und Together AI haben DeepCoder-14B-Preview veröffentlicht, ein Code-Reasoning-Modell, das durch verteiltes RL aus Deepseek-R1-Distilled-Qwen-14B feinabgestimmt wurde. Mit einer beeindruckenden Genauigkeit von 60,6 % Pass@1 auf LiveCodeBench konkurriert es mit OpenAIs o3-mini und verwendet dabei nur 14 B Parameter. Das Projekt veröffentlicht seinen Datensatz, Code, Trainingslogs und Systemoptimierungen als Open Source und zeigt ein robustes Trainingsrezept, das auf hochwertigen Daten und algorithmischen Verbesserungen von GRPO basiert. Dieser Fortschritt demokratisiert den Zugang zu leistungsstarken Code-Generierungsmodellen.