学習不要な画像編集:Stable Flowによる革命

2025-01-28
学習不要な画像編集:Stable Flowによる革命

Stable Flowは、Diffusion Transformer (DiT)モデルを利用した、学習不要な画像編集手法です。様々な画像編集操作、具体的には非剛体編集、オブジェクトの追加、削除、グローバルシーン編集などを、注意機構の特徴を選択的に注入することで実現します。UNetベースのモデルとは異なり、DiTは粗から細への合成構造を欠いているため、研究者らはDiT内で画像形成に不可欠な「重要な層」を自動的に特定する手法を提案しました。ソース画像の生成軌跡からの特徴を編集対象画像の軌跡に注入することで、Stable Flowは一貫性があり安定した編集を可能にします。さらに、実画像編集のための改良された画像反転手法も導入されています。実験結果は、Stable Flowが様々なアプリケーションにおいて有効であることを示しています。

続きを読む