اختبار عشوائية نماذج اللغات الكبيرة يكشف عن تحيز غير متوقع

2025-04-30

أجرى هذا الاختبار اختبارًا لعشوائية العديد من نماذج اللغات الكبيرة (LLMs) من OpenAI و Anthropic. من خلال جعل النماذج تقذف عملة معدنية وتتنبأ بأرقام عشوائية بين 0 و 10، اكتشف الباحثون تحيزًا كبيرًا في نتائجها، مما يكشف أنها ليست عشوائية حقًا. على سبيل المثال، في تجربة رمي العملة، أظهرت جميع النماذج تفضيلًا لـ "صورة الوجه"، حيث أظهر GPT-o1 التحيز الأكثر تطرفًا بنسبة 49٪. في التنبؤ بالأرقام الزوجية/الفردية، فضلت معظم النماذج الأرقام الفردية، حيث أظهر Claude 3.7 Sonnet أقوى تحيز بنسبة 47٪. تُبرز النتائج أن حتى نماذج LLMs المتقدمة قد تُظهر أنماطًا غير متوقعة تتأثر بتوزيعات بيانات التدريب الخاصة بها.

اقرأ المزيد
الذكاء الاصطناعي العشوائية التحيز

صعود وسقوط التسويق الخارجي المدعوم بالذكاء الاصطناعي

2025-04-28

أحدثت الأدوات المدعومة بالذكاء الاصطناعي ثورة في التسويق الخارجي، مما أتاح حملات مُخصصة للغاية على نطاق واسع. ومع ذلك، فإن هذه القابلية للتوسع قد تؤدي إلى إرهاق المستخدم وانخفاض العائدات. يتنبأ الكاتب بأن الشركات التي لديها قنوات توزيع قوية وعلاقات راسخة مع المستخدمين ستزدهر. سيصبح التسويق الشفهي وبناء المجتمعات ميزات تنافسية حاسمة، بينما ستتضاءل الاعتماد على الاكتساب المدفوع الذي يديره الذكاء الاصطناعي.

اقرأ المزيد

نماذج اللغات الكبيرة القائمة على الانتشار: تغيير جذري في نماذج اللغات

2025-03-06

كشفت شركة Inception Labs عن نموذج لغة كبير قائم على الانتشار (dLLM) ثوري يتحدى النهج التلقائي التكراري التقليدي. على عكس النماذج التلقائية التكرارية التي تتنبأ بالرموز بشكل تسلسلي، تولد نماذج dLLM مقاطع نصية في وقت واحد، وتُحسّنها بشكل تكراري. هذه الطريقة، التي حققت نجاحًا في نماذج الصور والفيديو، تتفوق الآن على نماذج LLMs من نفس الحجم في توليد الأكواد، مع تحسين السرعة والكفاءة بنسبة تتراوح بين 5 و 10 أضعاف. الميزة الرئيسية؟ تقليل الهلوسة. تولد نماذج dLLM وتُصحّح الأجزاء المهمة قبل المتابعة، وهو أمر بالغ الأهمية للتطبيقات التي تتطلب الدقة، مثل روبوتات الدردشة والوكلاء الذكيين. هذا النهج يعد بتحسين سير عمل الوكلاء متعددي الخطوات، وتجنب الدورات، وتحسين التخطيط، والتفكير، والتصحيح الذاتي.

اقرأ المزيد
الذكاء الاصطناعي توليد الاكواد