s1: تحجيم بسيط وقت الاختبار لأداء استنتاجي قوي
2025-02-03
تُقدم هذه الورقة البحثية s1، وهي طريقة بسيطة للتحجيم وقت الاختبار تحقق أداءً استنتاجيًا قويًا يضاهي o1-preview باستخدام 1000 مثال فقط وفرض ميزانية. تُحسّن هذه الطريقة أداء نماذج اللغة الكبيرة بشكل ملحوظ من خلال استراتيجيات ذكية وقت الاختبار. وقد تم نشر الرمز والبيانات كمصدر مفتوح من أجل التكرار والاستكشاف الإضافي.