Open-R1: إعادة إنتاج مفتوحة المصدر لنموذج الاستدلال DeepSeek-R1

2025-01-28
Open-R1: إعادة إنتاج مفتوحة المصدر لنموذج الاستدلال DeepSeek-R1

أذهلت قدرات الاستدلال المذهلة لنموذج DeepSeek-R1 مجتمع الذكاء الاصطناعي، لكن تفاصيل تدريبه لا تزال غير مُكشَفة. يهدف مشروع Open-R1 إلى إعادة إنتاج DeepSeek-R1 بالكامل كمصدر مفتوح، بما في ذلك مجموعات البيانات وأنابيب التدريب. سيشمل ذلك استخراج مجموعة بيانات استدلال عالية الجودة من DeepSeek-R1، وإعادة إنتاج عملية التدريب الخاصة به من خلال التعلم المعزز الخالص، واستكشاف أساليب التدريب متعددة المراحل. والهدف النهائي هو إنشاء نموذج استدلال شفاف وقابل للتكاثر، مما يدفع التقدم داخل مجتمع المصدر المفتوح.

الذكاء الاصطناعي