Open-R1: إعادة إنتاج مفتوحة المصدر لنموذج الاستدلال DeepSeek-R1

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-01-28

أذهلت قدرات الاستدلال المذهلة لنموذج DeepSeek-R1 مجتمع الذكاء الاصطناعي، لكن تفاصيل تدريبه لا تزال غير مُكشَفة. يهدف مشروع Open-R1 إلى إعادة إنتاج DeepSeek-R1 بالكامل كمصدر مفتوح، بما في ذلك مجموعات البيانات وأنابيب التدريب. سيشمل ذلك استخراج مجموعة بيانات استدلال عالية الجودة من DeepSeek-R1، وإعادة إنتاج عملية التدريب الخاصة به من خلال التعلم المعزز الخالص، واستكشاف أساليب التدريب متعددة المراحل. والهدف النهائي هو إنشاء نموذج استدلال شفاف وقابل للتكاثر، مما يدفع التقدم داخل مجتمع المصدر المفتوح.

الذكاء الاصطناعي