TokenVerse : Personnalisation multi-concepts dans les modèles de diffusion texte-image

2025-01-28
TokenVerse : Personnalisation multi-concepts dans les modèles de diffusion texte-image

TokenVerse présente une nouvelle méthode de personnalisation multi-concepts utilisant un modèle de diffusion texte-image pré-entraîné. Il démêle des éléments visuels et des attributs complexes à partir d'une seule image, permettant la génération transparente de combinaisons de concepts extraits de plusieurs images. Contrairement aux méthodes existantes, limitées dans le type ou l'étendue des concepts, TokenVerse gère plusieurs images avec plusieurs concepts chacune, prenant en charge les objets, les accessoires, les matériaux, la pose et l'éclairage. En optimisant pour des directions distinctes dans l'espace de modulation du modèle pour chaque mot, il génère des images combinant les concepts souhaités. Des expériences démontrent son efficacité dans des contextes de personnalisation exigeants.

Lire plus
IA