نماذج اللغات الكبيرة تفشل بشكل أنيق: يتدهور الأداء في السياقات الطويلة حتى في المهام البسيطة

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-07-15

يتحدى هذا البحث الافتراض الشائع بأن نماذج اللغات الكبيرة (LLMs) تقدم أداءً موحدًا في مهام السياق الطويل. من خلال توسيع معيار البحث عن الإبرة في كومة القش وإدخال متغيرات مثل المطابقة الدلالية والمشتتات، وجد الباحثون أنه حتى في ظل ظروف مبسطة، يتدهور أداء النموذج مع زيادة طول المدخلات. تم تأكيد ذلك في أسئلة وأجوبة محادثة وفي مهمة تكرار الكلمات المتكررة، مما يكشف عن قيود قدرات LLMs في السياقات الطويلة ويقترح تحديات محتملة في التطبيقات الواقعية.