ACE-Step: Um Avanço nos Modelos Fundamentais de Geração de Música
O ACE-Step é um novo modelo fundamental de código aberto para geração de música que integra geração baseada em difusão com um Autoencoder de Compressão Profunda e um transformador linear leve. Essa abordagem supera as compensações entre velocidade, coerência e controle encontradas em modelos LLM e de difusão existentes. O ACE-Step gera até 4 minutos de música em 20 segundos em uma GPU A100 — 15 vezes mais rápido que os modelos base LLM — mantendo a coerência musical superior e o alinhamento de letras. Ele suporta diversos estilos, gêneros e 19 idiomas, e oferece controles avançados como clonagem de voz e edição de letras. O projeto visa ser a 'Stable Diffusion' da IA de música, fornecendo uma base flexível para futuras ferramentas de criação musical.