TokenVerse: Multi-Konzept-Personalisierung in Text-zu-Bild-Diffusionsmodellen

2025-01-28
TokenVerse: Multi-Konzept-Personalisierung in Text-zu-Bild-Diffusionsmodellen

TokenVerse stellt eine neue Methode zur Multi-Konzept-Personalisierung vor, die ein vortrainiertes Text-zu-Bild-Diffusionsmodell nutzt. Es entwirrt komplexe visuelle Elemente und Attribute aus einem einzigen Bild und ermöglicht die nahtlose Generierung von Kombinationen von Konzepten, die aus mehreren Bildern extrahiert wurden. Im Gegensatz zu bestehenden Methoden, die entweder in der Art oder der Breite der Konzepte eingeschränkt sind, verarbeitet TokenVerse mehrere Bilder mit jeweils mehreren Konzepten und unterstützt Objekte, Accessoires, Materialien, Pose und Beleuchtung. Durch die Optimierung für eindeutige Richtungen im Modulationsraum des Modells für jedes Wort generiert es Bilder, die die gewünschten Konzepte kombinieren. Experimente zeigen seine Effektivität in anspruchsvollen Personalisierungseinstellungen.

Mehr lesen