ضجة نماذج اللغات الكبيرة: مقاييس الأداء مقابل الواقع
2025-04-06
وجدت شركة ناشئة تستخدم نماذج الذكاء الاصطناعي لفحص أمان التعليمات البرمجية تحسينات عملية محدودة على الرغم من ارتفاع درجات مقاييس الأداء منذ يونيو 2024. يجادل الكاتب بأن التطورات في نماذج اللغات الكبيرة لم تُترجم إلى فائدة اقتصادية أو تعميم، مما يتناقض مع الادعاءات العامة. هذا يثير مخاوف بشأن أساليب تقييم نماذج الذكاء الاصطناعي واحتمال المبالغة في قدراتها من قبل مختبرات الذكاء الاصطناعي. يدعو الكاتب إلى التركيز على أداء التطبيقات الواقعية بدلاً من درجات مقاييس الأداء، ويسلط الضوء على الحاجة إلى تقييم شامل قبل نشر الذكاء الاصطناعي في سياقات اجتماعية.
الذكاء الاصطناعي
أمان التعليمات البرمجية