R1-Zero من DeepSeek: مسار نحو الذكاء الاصطناعي العام بدون تدخل بشري؟
2025-01-29

أصدرت DeepSeek نظامي الاستنتاج R1-Zero و R1، وحققا نتائج مماثلة لنظام o1 من OpenAI (15-20%) في اختبار ARC-AGI-1، متجاوزين بذلك نسبة 5% التي حققها GPT-4o والذي يعتمد فقط على توسيع نطاق نماذج اللغات الكبيرة. يتميز R1-Zero بشكل خاص باعتماده الكامل على تقنية التعلم المعزز، مما يلغي الحاجة إلى التدقيق الدقيق الخاضع للإشراف (SFT). على الرغم من أن R1-Zero يواجه بعض التحديات فيما يتعلق بقابلية القراءة وخلط اللغات، إلا أنه أظهر أداءً قوياً في مجالات الرياضيات والترميز، مما يدل على قدرته على الاستنتاج بدقة باستخدام سلسلة من الأفكار دون الحاجة إلى SFT. يفتح هذا الأمر آفاقًا جديدة في مجال أبحاث الذكاء الاصطناعي العام، ما يشير إلى إمكانية التخلص تمامًا من التدخل البشري في تدريب نماذج الذكاء الاصطناعي العام في المستقبل.
الذكاء الاصطناعي