ACE-Step: Ein großer Schritt für Musikgenerierungs-Grundmodelle
ACE-Step ist ein neues Open-Source-Grundmodell für die Musikgenerierung, das diffusionsbasierte Generierung mit einem Deep Compression AutoEncoder und einem leichten linearen Transformer kombiniert. Dieser Ansatz überwindet die Kompromisse zwischen Geschwindigkeit, Kohärenz und Steuerbarkeit, die bei bestehenden LLM- und Diffusionsmodellen auftreten. ACE-Step generiert bis zu 4 Minuten Musik in nur 20 Sekunden auf einer A100-GPU – 15-mal schneller als LLM-basierte Basismodelle – und erreicht gleichzeitig eine überlegene musikalische Kohärenz und Textausrichtung. Es unterstützt verschiedene Stile, Genres und 19 Sprachen und bietet erweiterte Steuerungsmechanismen wie Sprachklonung, Texteditor und Remixing. Das Projekt zielt darauf ab, die „Stable Diffusion“ der Musik-KI zu sein und eine flexible Grundlage für zukünftige Musikerstellungstools zu bieten.