نموذج CSM من سيسامي: كلام شبه بشري، لكنه لا يزال قيد التطوير
2025-03-05
انتشر فيديو يبرز نموذج الكلام الجديد من سيسامي، CSM، بشكل واسع. بناءً على بنية Llama من ميتا، ينتج النموذج محادثات واقعية بشكل ملحوظ، مما يمحو الخط الفاصل بين الإنسان والذكاء الاصطناعي. باستخدام محول أحادي الوضع، متعدد الوسائط، فإنه يعالج النص والصوت في وقت واحد، على عكس الأساليب التقليدية المكونة من مرحلتين. في حين أن الاختبارات العمياء تُظهر جودة شبه بشرية للعينات الصوتية المعزولة، إلا أن السياق المحادثي يُظهر تفضيلاً للكلام البشري الحقيقي. يُقرّ المؤسس المشارك لسيسامي، برندان إريبي، بالتحديات المستمرة فيما يتعلق بالنبرة والإيقاع والانقطاعات، مع الاعتراف بأن النموذج لا يزال قيد التطوير، لكنه يعرب عن تفاؤله للمستقبل.
الذكاء الاصطناعي
كلام الذكاء الاصطناعي