TokenVerse: Personalização Multi-Conceito em Modelos de Difusão de Texto para Imagem

O TokenVerse apresenta um novo método para personalização multi-conceito, utilizando um modelo de difusão pré-treinado de texto para imagem. Ele desfaz elementos visuais e atributos complexos de uma única imagem, permitindo a geração perfeita de combinações de conceitos extraídos de várias imagens. Ao contrário dos métodos existentes, limitados no tipo ou amplitude de conceito, o TokenVerse lida com várias imagens, cada uma com vários conceitos, suportando objetos, acessórios, materiais, pose e iluminação. Ao otimizar para direções distintas no espaço de modulação do modelo para cada palavra, ele gera imagens combinando os conceitos desejados. Experimentos demonstram sua eficácia em configurações de personalização desafiadoras.
Leia mais