AIによるアクセント強度の定量化:BoldVoiceの潜在空間アプローチ
2025-05-06
AI搭載のアクセントコーチングアプリBoldVoiceは、「アクセントフィンガープリント」という、大規模なアクセント付き音声モデルから生成される埋め込みを使用して、英語を母国語としない話者のアクセントの強さを定量化します。PLS回帰とUMAP次元削減を用いて1000の音声録音データを潜在空間に可視化することで、アクセントの強さを視覚的に表現するモデルを作成します。このモデルは、母国語に関係なく、客観的にアクセントの強さを測定し、学習の進捗状況を追跡します。ケーススタディでは、これが学習者の改善にどのように役立つのかを示し、ASRやTTSシステムへの潜在的な応用について考察しています。
続きを読む
AI