DeepSeek V3: أداء متميز بموارد محدودة
2025-01-23

النموذج الجديد V3 من DeepSeek، والذي تم تدريبه على 2048 وحدة معالجة رسوميات H800 فقط - وهو جزء صغير من الموارد التي تستخدمها شركات عملاقة مثل OpenAI - يعادل أو يتجاوز GPT-4 و Claude في العديد من المعايير. تكلفة تدريبه البالغة 5.5 مليون دولار أقل بكثير من التكلفة المقدرة لـ GPT-4 والتي تبلغ 40 مليون دولار. هذا النجاح، الذي كان مدفوعًا جزئيًا بمراقبة الصادرات الأمريكية التي تحد من الوصول إلى وحدات معالجة الرسوميات المتطورة، يبرز إمكانات الابتكار المعماري وتحسين الخوارزميات مقارنة بقدرة الحوسبة البحتة. إنها حجة مقنعة على أن قيود الموارد يمكن أن تؤدي، بشكل متناقض، إلى تحقيق تقدم ثوري في تطوير الذكاء الاصطناعي.