DeepCoder-14B: نموذج استدلال أكواد مفتوح المصدر يضاهي o3-mini من OpenAI

2025-04-09
DeepCoder-14B: نموذج استدلال أكواد مفتوح المصدر يضاهي o3-mini من OpenAI

أصدرت Agentica و Together AI نموذج DeepCoder-14B-Preview، وهو نموذج استدلال أكواد مُحسّن من خلال تعلم تقوية مُوزّع من Deepseek-R1-Distilled-Qwen-14B. حقّق دقة مُبهرة بلغت 60.6% Pass@1 على LiveCodeBench، مما يُنافسه مع o3-mini من OpenAI، باستخدام 14 مليار معامل فقط. يُتيح المشروع الوصول إلى مجموعة البيانات، والرمز، وسجلات التدريب، وتحسينات النظام كمصدر مفتوح، مُظهراً وصفة تدريب قوية مبنية على بيانات عالية الجودة وتحسينات خوارزمية لـ GRPO. يُعزز هذا التقدم إمكانية الوصول إلى نماذج توليد الأكواد عالية الأداء.

الذكاء الاصطناعي استدلال الأكواد