Baseten تحقق أداءً متطورًا على GPT-OSS-120B: سباق مع الزمن

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-08-07

كشريك إطلاق لنموذج اللغة الكبير مفتوح المصدر الجديد من OpenAI، سارع Baseten لتحسين GPT-OSS-120B لتحقيق أقصى أداء في يوم الإطلاق. لقد استخدموا مجموعة الاستدلال المرنة الخاصة بهم، واختبروا باستخدام TensorRT-LLM و vLLM و SGLang، مع دعم لعمارة معالجات الرسومات Hopper و Blackwell. تضمنت التحسينات الرئيسية توجيهًا مدركًا لـ KV cache و فك ترميزًا مضاربًا باستخدام Eagle. مع إعطاء الأولوية للكفاءة، اختاروا التوازي المتوتر واستخدموا الواجهة الخلفية MoE من TensorRT-LLM. قام الفريق بحل مشكلات التوافق بسرعة، وصقلوا تكوين النموذج باستمرار، مساهمين في المجتمع مفتوح المصدر. ستشمل التحسينات المستقبلية فك التشفير المضارب للحصول على استدلال أسرع.