نماذج اللغات الكبيرة تفشل بشكل أنيق: يتدهور الأداء في السياقات الطويلة حتى في المهام البسيطة

2025-07-15
نماذج اللغات الكبيرة تفشل بشكل أنيق: يتدهور الأداء في السياقات الطويلة حتى في المهام البسيطة

يتحدى هذا البحث الافتراض الشائع بأن نماذج اللغات الكبيرة (LLMs) تقدم أداءً موحدًا في مهام السياق الطويل. من خلال توسيع معيار البحث عن الإبرة في كومة القش وإدخال متغيرات مثل المطابقة الدلالية والمشتتات، وجد الباحثون أنه حتى في ظل ظروف مبسطة، يتدهور أداء النموذج مع زيادة طول المدخلات. تم تأكيد ذلك في أسئلة وأجوبة محادثة وفي مهمة تكرار الكلمات المتكررة، مما يكشف عن قيود قدرات LLMs في السياقات الطويلة ويقترح تحديات محتملة في التطبيقات الواقعية.

الذكاء الاصطناعي السياق الطويل