ACE-Step: Un Salto Adelante en los Modelos Fundamentales de Generación de Música
ACE-Step es un nuevo modelo fundamental de código abierto para la generación de música que integra la generación basada en difusión con un Autoencoder de Compresión Profunda y un transformador lineal ligero. Este enfoque supera las compensaciones entre velocidad, coherencia y control que se encuentran en los modelos LLM y de difusión existentes. ACE-Step genera hasta 4 minutos de música en 20 segundos en una GPU A100, 15 veces más rápido que los modelos base LLM, manteniendo una coherencia musical superior y una alineación de letras. Admite diversos estilos, géneros y 19 idiomas, y ofrece controles avanzados como la clonación de voz y la edición de letras. El proyecto pretende ser la 'Stable Diffusion' de la IA de música, proporcionando una base flexible para futuras herramientas de creación musical.