Sesames Sprung: Überwindung des Uncanny Valley in der Konversationssprache
2025-03-02
Das Sesame-Forschungsteam hat erhebliche Fortschritte bei der Entwicklung natürlicherer und emotional intelligenter KI-Sprachassistenten erzielt. Ihr Konversationssprachmodell (CSM) nutzt multimodales Lernen, um kontextuell passende Sprache zu generieren, indem Kontext, Emotionen und Gesprächsverlauf berücksichtigt werden. Diese Technologie übertrifft traditionelle Text-to-Speech-Modelle (TTS) und zeigt durch objektive und subjektive Bewertungen Verbesserungen in Natürlichkeit und Ausdruckskraft. Derzeit unterstützt das Modell jedoch hauptsächlich Englisch. Zukünftig soll die Unterstützung weiterer Sprachen erweitert und das Verständnis komplexer Gesprächsstrukturen verbessert werden.