أبل تكشف عن حدود قدرات نماذج اللغة الكبيرة على الاستدلال

2025-06-16
أبل تكشف عن حدود قدرات نماذج اللغة الكبيرة على الاستدلال

تُشكك ورقة أبل الجديدة، "وهم التفكير"، في الافتراضات المتعلقة بنماذج اللغة الكبيرة (LLMs). تُظهر التجارب المُتحكم فيها عتبةً حرجةً تتجاوزها حتى أفضل نماذج LLMs وتفشل تمامًا في حل المشكلات المعقدة. الأداء لا يتدهور تدريجيًا؛ بل ينهار. تتوقف النماذج عن المحاولة، حتى مع وجود موارد كافية، مما يُظهر فشلًا في السلوك وليس نقصًا في القدرات. الأمر المقلق هو أن نتائج النماذج تبدو مُقنعة حتى عندما تكون خاطئة تمامًا، مما يُصعّب اكتشاف الأخطاء. تُبرز هذه الأبحاث ضرورة وجود أنظمة استدلال حقيقية وفهم أوضح لحدود النماذج الحالية.

اقرأ المزيد
الذكاء الاصطناعي