Modelo de Detecção de Turno de Voz Aberto: Smart Turn
2025-03-06
A equipe Pipecat lançou o Smart Turn, um modelo de detecção de turno de voz de código aberto projetado para melhorar os sistemas de IA de voz existentes baseados em detecção de atividade de voz (VAD). Usando o Wav2Vec2-BERT da Meta AI como base, com uma cabeça de classificação simples de duas camadas, o modelo atualmente suporta inglês e está em um estágio inicial de prova de conceito. No entanto, a equipe está confiante de que o desempenho pode ser rapidamente melhorado. Eles convidam contribuições da comunidade para melhorar o modelo e expandir seu suporte de idioma e recursos.
IA