اختراق DeepSeek للذكاء الاصطناعي: تجاوز CUDA لتحقيق كفاءة أعلى بعشر مرات
2025-01-29
حققت شركة DeepSeek زيادة في كفاءة تدريب نماذج الذكاء الاصطناعي بمقدار عشرة أضعاف من خلال تجاوز معيار CUDA الصناعي واستخدام لغة برمجة PTX من Nvidia بدلاً من ذلك. باستخدام 2048 من وحدات معالجة الرسوميات Nvidia H800، دربوا نموذجًا لغويًا MoE يحتوي على 671 مليار معلمة في شهرين فقط. نشأ هذا الاختراق من تحسينات دقيقة لـ PTX من Nvidia، بما في ذلك إعادة تكوين موارد وحدة معالجة الرسوميات وتنفيذ خوارزميات خط الأنابيب المتقدمة. على الرغم من أن هذا النهج له تكاليف صيانة عالية، إلا أن انخفاض التكاليف بشكل كبير في التدريب أحدث صدمات في السوق، مما أدى حتى إلى انخفاض كبير في القيمة السوقية لشركة Nvidia.
الذكاء الاصطناعي