TokenVerse: 텍스트-이미지 확산 모델의 다중 개념 개인화

2025-01-28

TokenVerse는 사전 훈련된 텍스트-이미지 확산 모델을 활용한 다중 개념 개인화를 위한 새로운 방법입니다. 하나의 이미지에서 복잡한 시각적 요소와 속성을 분리하여 여러 이미지에서 추출된 개념 조합을 매끄럽게 생성할 수 있습니다. 기존 방법과 달리 개념의 유형이나 범위에 제한되지 않고, 각각 여러 개념을 포함하는 여러 이미지를 처리하며, 객체, 액세서리, 재료, 포즈, 조명 등을 지원합니다. 모델의 변조 공간에서 각 단어의 고유한 방향을 최적화하여 원하는 개념을 결합한 이미지를 생성합니다. 실험 결과 어려운 개인화 설정에서 효과적임을 입증했습니다.

(token-verse.github.io)

AI 개인화

Windows 7/Server 2008 R2: 단색 배경에서 30초 환영 화면 지연

YC 스타트업 SciPhi, AI 연구 엔지니어 채용