Sesame AI تطلق نموذجًا لغويًا محادثيًا صوتيًا بـ 1 مليار معلمة
2025-03-18
أطلقت مختبرات Sesame AI نموذج CSM (Conversational Speech Model) وهو نموذج توليد كلام محادث بـ 1 مليار معلمة، يعتمد على بنية Llama. يُنتج CSM رموزًا صوتية RVQ من مدخلات نصية وصوتية، ونقطة التحكم فيه متاحة على Hugging Face. كما يتوفر عرض توضيحي تفاعلي للصوت ومساحة على Hugging Face لاختبار توليد الصوت. على الرغم من قدرته على إنتاج أصوات متنوعة، إلا أن CSM لم يتم ضبطه بدقة على أصوات محددة ولديه دعم محدود للغات متعددة. تشدد Sesame AI على استخدامه لأغراض البحث والتعليم فقط، وتحظر تقليد الآخرين، ونشر المعلومات الخاطئة، والأنشطة غير القانونية.
الذكاء الاصطناعي