Quantifizierung der Akzentstärke mit KI: Der latente Raum-Ansatz von BoldVoice

2025-05-06

BoldVoice, eine KI-gestützte Akzent-Coaching-App, verwendet „Akzent-Fingerabdrücke“ – Einbettungen, die von einem groß angelegten Akzent-Sprachmodell generiert werden – um die Akzentstärke bei nicht-englischen Muttersprachlern zu quantifizieren. Durch die Visualisierung von 1000 Aufnahmen in einem latenten Raum mithilfe von PLS-Regression und UMAP-Dimensionsreduktion erstellt BoldVoice ein Modell, das die Akzentstärke visuell darstellt. Dieses Modell misst die Akzentstärke objektiv, unabhängig von der Muttersprache, und verfolgt den Lernfortschritt. Eine Fallstudie zeigt, wie dies Lernenden hilft, sich zu verbessern, mit potenziellen Anwendungen in ASR- und TTS-Systemen.

Mehr lesen
KI