DeepSeek-R1: نموذج لغة كبير مفتوح المصدر قادر على الاستدلال
2025-01-27
DeepSeek-R1 هو نموذج لغوي كبير (LLM) متطور يتميز بقدرات استدلالية رائعة. على عكس نماذج LLM التقليدية التي تكتفي بالتنبؤ بالكلمة التالية، يقوم DeepSeek-R1 بإنشاء "رموز تفكير" لحل المشكلات بشكل منهجي. تتضمن عملية تدريبه ثلاث مراحل: أولاً، يتم تدريب نموذج أساسي على مجموعات بيانات ضخمة؛ ثانياً، يتم إجراء ضبط دقيق تحت الإشراف باستخدام 600000 مثال على الاستدلال بسلسلة تفكير طويلة تم إنشاؤها بواسطة نموذج استدلال متخصص؛ وأخيراً، يتم استخدام التعلم المعزز لتحسين أداء كل من مهام الاستدلال وغير الاستدلال. يثبت نجاح DeepSeek-R1 أن الجمع بين نماذج أساسية عالية الجودة ومهام استدلال قابلة للتحقق تلقائيًا يقلل بشكل كبير من الاعتماد على البيانات المسمى، مما يمهد الطريق لتطورات مستقبلية في نماذج LLM.
اقرأ المزيد
الذكاء الاصطناعي