نماذج OpenAI الجديدة تعاني من الهلوسة أكثر: الأكبر ليس دائمًا الأفضل

2025-04-18
نماذج OpenAI الجديدة تعاني من الهلوسة أكثر: الأكبر ليس دائمًا الأفضل

نماذج o3 و o4-mini التي أطلقتها OpenAI مؤخرًا، على الرغم من أنها متطورة في نواحٍ كثيرة، إلا أنها تُظهر زيادة مقلقة في الهلوسة مقارنةً بأسلافها. تُظهر الاختبارات الداخلية معدلات هلوسة أعلى بكثير من نماذج الاستنتاج السابقة (o1 و o1-mini و o3-mini) وحتى النماذج التقليدية غير المتعلقة بالاستنتاج مثل GPT-4o. لا تعرف OpenAI سبب ذلك، مما يُشكل تحديًا للقطاعات التي تتطلب الدقة. تُؤكد اختبارات الجهات الخارجية هذه المشكلة، حيث يُخترع o3 خطوات في عملية استنتاجه. على الرغم من تفوقه في البرمجة والرياضيات، إلا أن معدل الهلوسة الأعلى يحد من قابليته للتطبيق. معالجة مشكلة هلوسة النماذج مجال رئيسي في أبحاث الذكاء الاصطناعي، ويبدو منح النماذج إمكانية البحث على الويب نهجًا واعدًا.

الذكاء الاصطناعي الهلوسة نماذج الاستنتاج