TokenVerse:基于扩散模型的多概念个性化图像生成
2025-01-28
TokenVerse 是一种利用预训练文本到图像扩散模型实现多概念个性化的新方法。它能够从单张图像中解耦复杂的视觉元素和属性,并无缝地生成来自多张图像中提取的概念组合。与现有方法相比,TokenVerse 能够处理包含多个概念的多张图像,并支持各种概念,包括物体、配饰、材质、姿势和光照。该方法利用基于 DiT 的文本到图像模型,通过优化找到每个单词在调制空间中的独特方向,从而生成结合所需配置的学习概念的新图像。实验结果表明,TokenVerse 在具有挑战性的个性化设置中非常有效。
AI