DeepSeek: نموذج لغة كبير مفتوح المصدر وموفر للتكلفة يتحدى ChatGPT
يُشكّل DeepSeek، وهو نموذج لغة كبير (LLM) مفتوح المصدر طُوّر بواسطة شركة صينية للأبحاث في مجال الذكاء الاصطناعي، تحديًا لـ ChatGPT من خلال هيكليته الفريدة المتمثلة في (MoE) أو خليط الخبراء. تتجلى كفاءته في تفعيل المعلمات الضرورية فقط، مما يؤدي إلى سرعات أعلى وتكاليف أقل. وتُمكّن الميزات مثل الانتباه متعدد الرؤوس والتنبؤ متعدد الرموز من تحقيق أداء متفوق في المحادثات الطويلة والتفكير المعقد. وعلى الرغم من المخاوف بشأن مصادر بياناته، إلا أن فعالية التكلفة لـ DeepSeek وأسلوبه المباشر في الإخراج يجعله بديلاً مقنعًا لـ ChatGPT.
اقرأ المزيد