Sesame AI veröffentlicht 1-Milliarden-Parameter-Konversations-Sprachmodell

2025-03-18
Sesame AI veröffentlicht 1-Milliarden-Parameter-Konversations-Sprachmodell

Die Sesame AI Labs haben CSM (Conversational Speech Model) veröffentlicht, ein Sprachgenerierungsmodell mit 1 Milliarde Parametern, das auf der Llama-Architektur basiert. CSM generiert RVQ-Audiocodes aus Text- und Audioeingaben, und sein Checkpoint ist auf Hugging Face verfügbar. Eine interaktive Sprachdemo und ein Hugging Face Space zum Testen der Audiogenerierung werden ebenfalls bereitgestellt. Obwohl es in der Lage ist, verschiedene Stimmen zu erzeugen, wurde CSM nicht auf bestimmte Stimmen feinabgestimmt und hat eine begrenzte mehrsprachige Unterstützung. Sesame AI betont die Verwendung nur für Forschungs- und Bildungszwecke und verbietet die Nachahmung, Falschinformationen und illegale Aktivitäten.