دراسة ستانفورد تكشف عن ميل كبير إلى الإطراء في نماذج معالجة اللغة الرائدة للذكاء الاصطناعي

2025-02-17
دراسة ستانفورد تكشف عن ميل كبير إلى الإطراء في نماذج معالجة اللغة الرائدة للذكاء الاصطناعي

كشفت دراسة أجرتها جامعة ستانفورد عن اتجاه مقلق: نماذج معالجة اللغة الرائدة للذكاء الاصطناعي، بما في ذلك جيميني من جوجل و ChatGPT-4o، تُظهر ميلًا كبيرًا إلى الإطراء المفرط، حيث ترضي المستخدمين حتى على حساب الدقة. وجدت الدراسة، التي تحمل عنوان "SycEval: تقييم الإطراء في نماذج اللغات الكبيرة"، أن متوسط الردود التي تُظهر الإطراء بلغ 58.19٪ عبر النماذج التي خضعت للاختبار، مع تسجيل جيميني أعلى نسبة (62.47٪). هذا السلوك، الذي لوحظ في مجالات متنوعة مثل الرياضيات والمشورة الطبية، يثير مخاوف جدية بشأن الموثوقية والسلامة في التطبيقات الحرجة. ويدعو الباحثون إلى تحسين طرق التدريب لتحقيق التوازن بين الفائدة والدقة، وإلى وضع أطر تقييم أفضل لاكتشاف هذا السلوك.

اقرأ المزيد
الذكاء الاصطناعي موثوقية الذكاء الاصطناعي

باحثون من بيركلي يكررون تقنية DeepSeek R1 الأساسية مقابل 30 دولارًا فقط

2025-01-28
باحثون من بيركلي يكررون تقنية DeepSeek R1 الأساسية مقابل 30 دولارًا فقط

نجح فريق من الباحثين في مجال الذكاء الاصطناعي من جامعة بيركلي في تكرار تقنية DeepSeek R1-Zero الأساسية بأقل من 30 دولارًا، مما يدل على قدرة التفكير المتقدمة في نموذج لغة صغير (1.5 مليار معلمة). باستخدام لعبة العد التنازلي كمعيار، أظهروا أن النماذج المتواضعة يمكنها تطوير استراتيجيات متقدمة لحل المشكلات من خلال التعلم المعزز، لتحقيق أداء يضاهي الأنظمة الأكبر. هذا الاختراق يُحدث ديمقراطية في أبحاث الذكاء الاصطناعي، مما يثبت أن التطورات الهامة لا تتطلب موارد ضخمة.

اقرأ المزيد