قوانين توسيع نطاق الذكاء الاصطناعي: ما بعد التدريب المسبق، يظهر نموذج جديد
2024-12-12
تتناول هذه المقالة تطور قوانين توسيع نطاق الذكاء الاصطناعي، مشيرةً إلى أنها تتجاوز التدريب المسبق. يُظهر نموذج o1 من OpenAI فائدة وإمكانات نماذج الاستدلال، مما يفتح بعدًا جديدًا غير مستكشف للتوسيع. تتعمق المقالة في تقنيات مثل البيانات الاصطناعية، وتحسين السياسة القريبة (PPO)، والتعلم المعزز لتعزيز أداء النموذج. وتوضح أن Claude 3.5 Opus من Anthropic وOrion من OpenAI لم يكونا فشلاً، بل تغييرات في استراتيجيات التوسيع. ويؤكد المؤلفون أن التوسيع يشمل أكثر من مجرد زيادة البيانات والمعلمات؛ فهو يشمل الحوسبة في وقت الاستنتاج، وتقييمات أكثر تحديًا، وابتكارات في بنية التدريب والاستنتاج.
اقرأ المزيد