ACE-Step:迈向音乐生成基础模型的一步

2025-05-06
ACE-Step:迈向音乐生成基础模型的一步

ACE-Step是一个开源的音乐生成基础模型,它结合了扩散模型和深度压缩自编码器,以及轻量级线性Transformer,解决了现有方法在生成速度、音乐连贯性和可控性之间的权衡问题。它能够在A100 GPU上以20秒的速度合成长达4分钟的音乐,速度比基于LLM的基线快15倍,同时实现了优越的音乐连贯性和歌词对齐。此外,ACE-Step支持多种语言、风格和乐器,并提供多种高级控制机制,例如语音克隆、歌词编辑和混音。该模型旨在成为音乐AI领域的“Stable Diffusion”,为音乐创作者提供强大的工具。

AI