تشريح مُحوِّل مُبَسَّط: الكشف عن آلية عمل نماذج اللغات الكبيرة باستخدام 10000 معلمة

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-09-04

تُقدّم هذه الورقة نموذج مُحوِّل مُبَسَّط بشكل جذري مع ما يقارب 10000 معلمة فقط، مما يوفر نظرة واضحة على آلية عمل نماذج اللغات الكبيرة (LLMs). باستخدام مجموعة بيانات مُصغّرة تركز على العلاقات بين الفواكه والأذواق، يحقق المؤلفون أداءً قويًا بشكل مُفاجئ. تُظهر المُشاهَدات البصرية كيفية عمل مُدخَلات الكلمات وآلية الانتباه. والأهم من ذلك، يُعمّم النموذج بما يتجاوز الحفظ، مُتوقعًا بشكل صحيح "الفلفل الحار" عند مُطالبته بـ "أُحب الحار لذا أُحب"، مُبيِّنًا المبادئ الأساسية لعمل LLMs بطريقة مُيسّرة للغاية.