Quantification de l'intensité de l'accent avec l'IA : approche de l'espace latent de BoldVoice

2025-05-06

BoldVoice, une application d'entraînement à l'accent basée sur l'IA, utilise des « empreintes digitales d'accent » — des plongements générés par un modèle de parole à accent à grande échelle — pour quantifier l'intensité de l'accent chez les locuteurs non natifs de l'anglais. En visualisant 1000 enregistrements dans un espace latent à l'aide de la régression PLS et de la réduction de dimensionnalité UMAP, BoldVoice crée un modèle qui représente visuellement l'intensité de l'accent. Ce modèle mesure objectivement l'intensité de l'accent, indépendamment de la langue maternelle, et suit les progrès de l'apprentissage. Une étude de cas montre comment cela aide les apprenants à s'améliorer, avec des applications potentielles dans les systèmes ASR et TTS.