开源语音轮次检测模型:Smart Turn

2025-03-06
开源语音轮次检测模型:Smart Turn

Pipecat团队发布了一个开源的语音轮次检测模型Smart Turn,旨在改进现有的基于语音活动检测(VAD)的语音AI系统。该模型使用Meta AI的Wav2Vec2-BERT作为基础,并添加了一个简单的两层分类头部。目前,该模型支持英语,并处于早期概念验证阶段,但团队相信其性能可以快速提升。他们邀请社区参与改进模型,并扩展其语言支持和功能。

AI