قفزة سمسم: تجاوز وادي الأشباح في الصوت المحادثاتي

2025-03-02
قفزة سمسم: تجاوز وادي الأشباح في الصوت المحادثاتي

حقق فريق البحث في سمسم تقدماً ملحوظاً في إنشاء مساعدين صوتيين للذكاء الاصطناعي أكثر طبيعية وعاطفية. يستخدم نموذجهم للكلام المحادثاتي (CSM) التعلم متعدد الوسائط لإنشاء كلام مناسب للسياق من خلال مراعاة السياق والعواطف وسجل المحادثة. تتفوق هذه التقنية على نماذج النص إلى كلام (TTS) التقليدية وتُظهر تحسينات في الطبيعية والتعبير من خلال تقييمات موضوعية وذاتية. ومع ذلك، يدعم النموذج حاليًا اللغة الإنجليزية بشكل أساسي، مع خطط مستقبلية لتوسيع نطاقه إلى المزيد من اللغات وتحسين فهمه لهياكل المحادثات المعقدة.