اتهام OpenAI بتدريب GPT-4o على كتب مدفوعة بدون ترخيص
2025-04-02
تتهم ورقة بحثية جديدة من مشروع الإفصاح عن الذكاء الاصطناعي شركة OpenAI باستخدام كتب مدفوعة بدون ترخيص، معظمها من O'Reilly Media، لتدريب نموذجها GPT-4o. تستخدم الورقة البحثية طريقة DE-COP لإظهار أن GPT-4o يُظهر قدرة أكبر بكثير على التعرف على محتوى O'Reilly المدفوع مقارنةً بـ GPT-3.5 Turbo، مما يشير إلى وجود بيانات غير مرخصة بشكل كبير في تدريبه. وعلى الرغم من أن OpenAI تمتلك بعض تراخيص البيانات وتوفر آليات إلغاء الاشتراك، إلا أن هذا يزيد من التحديات القانونية القائمة المتعلقة بممارسات حقوق النشر الخاصة بها. ويقر مؤلفو الورقة البحثية بوجود قيود في منهجيتهم، لكن النتائج تثير مخاوف جدية بشأن أساليب OpenAI في الحصول على البيانات.
الذكاء الاصطناعي