ARC-AGI-2: مقياس AGI أسهل للبشر، وأصعب للذكاء الاصطناعي

2025-03-24
ARC-AGI-2: مقياس AGI أسهل للبشر، وأصعب للذكاء الاصطناعي

تعود مسابقة ARC Prize 2025 مع ARC-AGI-2، وهو مقياس AGI أصعب بكثير للذكاء الاصطناعي ولكنه يبقى سهلاً نسبياً للبشر. من خلال التركيز على المهام السهلة للبشر ولكنها صعبة للذكاء الاصطناعي، يسلط ARC-AGI-2 الضوء على الفجوات في القدرات التي لا يتم سدها بمجرد توسيع نطاق النماذج الحالية. مع جائزة قدرها مليون دولار، تشجع المسابقة الابتكار مفتوح المصدر لأنظمة ذكاء اصطناعي فعالة وعامة، بهدف سد الفجوة بين البشر والذكاء الاصطناعي وتحقيق AGI الحقيقي.

اقرأ المزيد
الذكاء الاصطناعي

R1-Zero من DeepSeek: مسار نحو الذكاء الاصطناعي العام بدون تدخل بشري؟

2025-01-29
R1-Zero من DeepSeek: مسار نحو الذكاء الاصطناعي العام بدون تدخل بشري؟

أصدرت DeepSeek نظامي الاستنتاج R1-Zero و R1، وحققا نتائج مماثلة لنظام o1 من OpenAI (15-20%) في اختبار ARC-AGI-1، متجاوزين بذلك نسبة 5% التي حققها GPT-4o والذي يعتمد فقط على توسيع نطاق نماذج اللغات الكبيرة. يتميز R1-Zero بشكل خاص باعتماده الكامل على تقنية التعلم المعزز، مما يلغي الحاجة إلى التدقيق الدقيق الخاضع للإشراف (SFT). على الرغم من أن R1-Zero يواجه بعض التحديات فيما يتعلق بقابلية القراءة وخلط اللغات، إلا أنه أظهر أداءً قوياً في مجالات الرياضيات والترميز، مما يدل على قدرته على الاستنتاج بدقة باستخدام سلسلة من الأفكار دون الحاجة إلى SFT. يفتح هذا الأمر آفاقًا جديدة في مجال أبحاث الذكاء الاصطناعي العام، ما يشير إلى إمكانية التخلص تمامًا من التدخل البشري في تدريب نماذج الذكاء الاصطناعي العام في المستقبل.

اقرأ المزيد
الذكاء الاصطناعي

نظام o3 من OpenAI يحقق درجة ثورية في معيار ARC-AGI المرجعي

2024-12-20
نظام o3 من OpenAI يحقق درجة ثورية في معيار ARC-AGI المرجعي

حقق نظام o3 الجديد من OpenAI، المدرب على مجموعة بيانات التدريب العامة ARC-AGI-1، درجة ثورية بلغت 75.7% في مجموعة التقييم شبه الخاصة، متجاوزًا بذلك حدود نماذج اللغات الكبيرة السابقة. يمثل هذا قفزة نوعية في قدرات الذكاء الاصطناعي، حيث يُظهر قدرة على التكيف مع مهام جديدة لم يسبق لها مثيل في عائلة GPT. على الرغم من أنه لم يحقق بعد الذكاء الاصطناعي العام (AGI)، إلا أن نجاح o3 يبرز أهمية إعادة تركيب المعرفة في وقت الاختبار، ويوفر نقاط بيانات قيّمة للبحث المستمر في مجال AGI. لا تزال هناك تحديات قائمة، حيث يفشل o3 في بعض المهام البسيطة، مما يُبرز تعقيدات تحقيق AGI الحقيقي.

اقرأ المزيد
AI