اختراق DeepSeek للذكاء الاصطناعي: تجاوز CUDA لتحقيق كفاءة أعلى بعشر مرات

2025-01-29
اختراق DeepSeek للذكاء الاصطناعي: تجاوز CUDA لتحقيق كفاءة أعلى بعشر مرات

حققت شركة DeepSeek زيادة في كفاءة تدريب نماذج الذكاء الاصطناعي بمقدار عشرة أضعاف من خلال تجاوز معيار CUDA الصناعي واستخدام لغة برمجة PTX من Nvidia بدلاً من ذلك. باستخدام 2048 من وحدات معالجة الرسوميات Nvidia H800، دربوا نموذجًا لغويًا MoE يحتوي على 671 مليار معلمة في شهرين فقط. نشأ هذا الاختراق من تحسينات دقيقة لـ PTX من Nvidia، بما في ذلك إعادة تكوين موارد وحدة معالجة الرسوميات وتنفيذ خوارزميات خط الأنابيب المتقدمة. على الرغم من أن هذا النهج له تكاليف صيانة عالية، إلا أن انخفاض التكاليف بشكل كبير في التدريب أحدث صدمات في السوق، مما أدى حتى إلى انخفاض كبير في القيمة السوقية لشركة Nvidia.

الذكاء الاصطناعي