AI를 활용한 악센트 강도 정량화: BoldVoice의 잠재 공간 접근 방식

2025-05-06

AI 기반 악센트 코칭 앱인 BoldVoice는 대규모 악센트 음성 모델에서 생성된 임베딩인 '악센트 지문'을 사용하여 비원어민 영어 사용자의 악센트 강도를 정량화합니다. PLS 회귀와 UMAP 차원 축소를 사용하여 1000개의 음성 녹음을 잠재 공간에 시각화함으로써 악센트 강도를 시각적으로 나타내는 모델을 만듭니다. 이 모델은 모국어와 관계없이 객관적으로 악센트 강도를 측정하고 학습 진행 상황을 추적합니다. 사례 연구는 이것이 학습자의 개선에 어떻게 도움이 되는지 보여주고 ASR 및 TTS 시스템에 대한 잠재적 응용에 대해 논의합니다.

AI