ACE-Step:音楽生成基盤モデルへの一歩

2025-05-06
ACE-Step:音楽生成基盤モデルへの一歩

ACE-Stepは、拡散モデルと深層圧縮自己符号化器、軽量線形トランスフォーマーを統合した、新しいオープンソースの音楽生成基盤モデルです。既存のLLMや拡散モデルに見られる速度、一貫性、制御可能性のトレードオフを克服します。ACE-Stepは、A100 GPU上で最長4分の音楽を20秒で生成でき、LLMベースラインよりも15倍高速でありながら、優れた音楽的一貫性と歌詞の整合性を維持します。様々なスタイル、ジャンル、19言語に対応し、音声クローン、歌詞編集などの高度な制御機構を提供します。このプロジェクトは、音楽AIの「Stable Diffusion」を目指し、将来の音楽制作ツールの柔軟な基盤を提供することを目指しています。

AI