TokenVerse:テキストから画像への拡散モデルにおけるマルチコンセプトパーソナライゼーション

2025-01-28
TokenVerse:テキストから画像への拡散モデルにおけるマルチコンセプトパーソナライゼーション

TokenVerseは、事前学習済みのテキストから画像への拡散モデルを活用した、マルチコンセプトパーソナライゼーションのための新しい手法です。単一の画像から複雑な視覚要素と属性を分離し、複数の画像から抽出された概念の組み合わせをシームレスに生成できます。既存の手法とは異なり、概念の種類や範囲に制限されることなく、複数の概念を含む複数の画像を処理し、オブジェクト、アクセサリー、素材、ポーズ、ライティングなどをサポートします。モデルの変調空間における各単語の異なる方向を最適化することで、目的の概念を組み合わせた画像を生成します。実験により、困難なパーソナライゼーション設定における有効性が実証されました。

続きを読む