TAO من داتابريكس: تجاوز الضبط الدقيق باستخدام بيانات غير مُعلّمة
تُقدّم داتابريكس TAO (Test-time Adaptive Optimization)، وهي طريقة جديدة لضبط نماذج اللغات الكبيرة تتطلب فقط بيانات استخدام غير مُعلّمة. على عكس الضبط الدقيق التقليدي، يستخدم TAO الحوسبة في وقت الاختبار وتعلم التعزيز لتحسين أداء النموذج بناءً على أمثلة الإدخال السابقة. والمثير للدهشة أن TAO يتجاوز الضبط الدقيق التقليدي، ليُقارب نماذج المصدر المفتوح مثل Llama جودة النماذج الخاصة باهظة الثمن مثل GPT-4. هذه التقنية متاحة حاليًا في إصدار تجريبي مُسبق لعملاء داتابريكس، وستُدعم المنتجات المستقبلية.