Quantificando a Força do Acentom com IA: Abordagem do Espaço Latente do BoldVoice
2025-05-06
O BoldVoice, um aplicativo de coaching de sotaque com tecnologia de IA, usa 'impressões digitais de sotaque' — embeddings gerados por um modelo de fala com sotaque em larga escala — para quantificar a força do sotaque em falantes não nativos de inglês. Ao visualizar 1000 gravações em um espaço latente usando regressão PLS e redução de dimensionalidade UMAP, o BoldVoice cria um modelo que representa visualmente a força do sotaque. Este modelo mede objetivamente a força do sotaque, independentemente da língua nativa, e acompanha o progresso do aprendizado. Um estudo de caso mostra como isso ajuda os alunos a melhorar, com aplicações potenciais em sistemas ASR e TTS.
Leia mais