Voxtral: نماذج فهم الكلام مفتوحة المصدر تحدث ثورة في التفاعل بين الإنسان والحاسوب
2025-07-16
أصدرت Voxtral نموذجين متطورين لفهم الكلام: متغير 24 مليار معلمة للإنتاج ومتغير 3 مليار معلمة للنشر على الحافة، وكلاهما مرخص بموجب ترخيص Apache 2.0. تتميز هذه النماذج بدقة عالية في النسخ، وتتعامل مع الصوت الطويل (حتى 40 دقيقة)، وتتميز بوظائف مدمجة للأسئلة والأجوبة والتلخيص، وتوفر دعمًا متعدد اللغات أصليًا. بشكل ملحوظ، تتفوق Voxtral على واجهات برمجة التطبيقات المماثلة من حيث التكلفة، مما يجعل ذكاء الكلام عالي الجودة في متناول الجميع وقابل للتحكم على نطاق واسع. إنها تجسر الفجوة بين الأنظمة مفتوحة المصدر ذات معدلات الخطأ العالية وواجهات برمجة التطبيقات الخاصة باهظة الثمن، وتوفر إمكانيات استدعاء الوظائف التي تترجم أوامر الكلام مباشرةً إلى إجراءات النظام. تستعد Voxtral لإحداث ثورة في التفاعل بين الإنسان والحاسوب.
الذكاء الاصطناعي