芝麻团队:跨越语音交互的「恐怖谷」
2025-03-02
芝麻团队的研究人员在探索如何让AI语音助手更自然、更具情感方面取得了显著进展。他们开发的会话语音模型(CSM)利用多模态学习,通过考虑上下文、情感和对话历史,生成更符合情境的语音。这项技术超越了传统的文本转语音(TTS)模型,并通过一系列客观和主观评估证明了其在自然度和表达力上的提升。然而,该模型目前主要支持英语,未来将扩展到更多语言,并进一步提升其对复杂对话结构的理解能力。
阅读更多