TokenVerse: Personalización Multiconscepto en Modelos de Difusión de Texto a Imagen
TokenVerse presenta un nuevo método para la personalización multiconscepto que aprovecha un modelo de difusión de texto a imagen preentrenado. Desentraña elementos visuales y atributos complejos a partir de una sola imagen, permitiendo la generación fluida de combinaciones de conceptos extraídos de múltiples imágenes. A diferencia de los métodos existentes, limitados en el tipo o amplitud de conceptos, TokenVerse maneja múltiples imágenes con múltiples conceptos cada una, admitiendo objetos, accesorios, materiales, pose e iluminación. Al optimizar para direcciones distintas en el espacio de modulación del modelo para cada palabra, genera imágenes que combinan los conceptos deseados. Los experimentos demuestran su eficacia en entornos de personalización desafiantes.