DeepSeek V3: أداء متميز بموارد محدودة

2025-01-23
DeepSeek V3: أداء متميز بموارد محدودة

النموذج الجديد V3 من DeepSeek، والذي تم تدريبه على 2048 وحدة معالجة رسوميات H800 فقط - وهو جزء صغير من الموارد التي تستخدمها شركات عملاقة مثل OpenAI - يعادل أو يتجاوز GPT-4 و Claude في العديد من المعايير. تكلفة تدريبه البالغة 5.5 مليون دولار أقل بكثير من التكلفة المقدرة لـ GPT-4 والتي تبلغ 40 مليون دولار. هذا النجاح، الذي كان مدفوعًا جزئيًا بمراقبة الصادرات الأمريكية التي تحد من الوصول إلى وحدات معالجة الرسوميات المتطورة، يبرز إمكانات الابتكار المعماري وتحسين الخوارزميات مقارنة بقدرة الحوسبة البحتة. إنها حجة مقنعة على أن قيود الموارد يمكن أن تؤدي، بشكل متناقض، إلى تحقيق تقدم ثوري في تطوير الذكاء الاصطناعي.

اقرأ المزيد

شتاء الشركات الناشئة: فقدت Hacker News إيمانها بأسطورة الشركات الناشئة

2025-01-21
شتاء الشركات الناشئة: فقدت Hacker News إيمانها بأسطورة الشركات الناشئة

تبرز مشاركة حديثة على Hacker News تحولاً في المشاعر تجاه الشركات الناشئة. فبينما كان مؤسسو الشركات الفاشلة يتلقون تعليقات داعمة في عام 2013، فإن القصص المماثلة الآن تُستقبل بالتشكيك في المخاطر. ويعزى هذا التغيير إلى: زيادة وضوح العواقب السلبية (الإرهاق، ومشاكل العلاقات، والصحة النفسية)؛ ارتفاع الرواتب في شركات التكنولوجيا الكبرى مما يجعل الحافز المالي للشركات الناشئة أقل جاذبية؛ وظهور قيود نموذج رأس المال المخاطر؛ وجني ثمار عصر الأجهزة المحمولة/الويب بسهولة إلى حد كبير. ويقترح الكاتب أن هذا يشير إلى "شتاء الشركات الناشئة"، مما قد يؤدي إلى نظام بيئي للشركات الناشئة أكثر أصالة واستدامة.

اقرأ المزيد