DeepSeek: نموذج لغة كبير مفتوح المصدر وموفر للتكلفة يتحدى ChatGPT

2025-02-08
DeepSeek: نموذج لغة كبير مفتوح المصدر وموفر للتكلفة يتحدى ChatGPT

يُشكّل DeepSeek، وهو نموذج لغة كبير (LLM) مفتوح المصدر طُوّر بواسطة شركة صينية للأبحاث في مجال الذكاء الاصطناعي، تحديًا لـ ChatGPT من خلال هيكليته الفريدة المتمثلة في (MoE) أو خليط الخبراء. تتجلى كفاءته في تفعيل المعلمات الضرورية فقط، مما يؤدي إلى سرعات أعلى وتكاليف أقل. وتُمكّن الميزات مثل الانتباه متعدد الرؤوس والتنبؤ متعدد الرموز من تحقيق أداء متفوق في المحادثات الطويلة والتفكير المعقد. وعلى الرغم من المخاوف بشأن مصادر بياناته، إلا أن فعالية التكلفة لـ DeepSeek وأسلوبه المباشر في الإخراج يجعله بديلاً مقنعًا لـ ChatGPT.

اقرأ المزيد
الذكاء الاصطناعي

نظرة داخلية إلى ChatGPT: منظور المبرمجين

2025-01-04
نظرة داخلية إلى ChatGPT: منظور المبرمجين

تقدم هذه المقالة شرحًا تفصيليًا لكيفية عمل ChatGPT، موجهًا بشكل خاص للمبرمجين. تتجاوز المقالة المفاهيم العامة للذكاء الاصطناعي/التعلم الآلي، وتركز على نموذج ChatGPT من OpenAI، موضحة بنيته، واستخدام شبكات المحولات، وكيفية ضبط التعلم المعزز من خلال التغذية الراجعة البشرية (RLHF) ليتناسب مع مهام المحادثة. كما تفصل المقالة عملية التجزئة، وتدريب النموذج، وتوليد الاستجابات، ودور RLHF في ضمان استجابات دقيقة وسياقية.

اقرأ المزيد
التطوير