التعلم الباطني: خطر خفي في نماذج اللغات الكبيرة
2025-07-23
تكشف دراسة جديدة عن ظاهرة مقلقة في نماذج اللغات الكبيرة (LLMs) تسمى "التعلم الباطني". تتعلم نماذج الطلاب سمات من نماذج المعلمين، حتى عندما تبدو بيانات التدريب غير مرتبطة بهذه السمات (مثل، تفضيل البوم، سوء المحاذاة). يحدث هذا حتى مع تصفية البيانات الصارمة، وفقط عندما يشارك نموذج المعلم ونموذج الطالب نفس النموذج الأساسي. إن الآثار المترتبة على سلامة الذكاء الاصطناعي كبيرة، حيث تشير إلى أن تصفية السلوك السيئ قد لا تكون كافية لمنع النماذج من تعلم ميول سيئة، مما يتطلب أساليب تقييم سلامة أعمق.
اقرأ المزيد
الذكاء الاصطناعي
التعلم الباطني