FontDiffuser: 확산 모델 기반의 원샷 폰트 생성의 획기적인 발전
2025-04-24
FontDiffuser는 폰트 모방 작업을 노이즈 제거 패러다임으로 모델링한 새로운 확산 모델 기반의 원샷 폰트 생성 방법입니다. 복잡한 문자와 큰 스타일 변화에 대한 기존 방법의 한계를 해결하기 위해 FontDiffuser는 다중 스케일 콘텐츠 집계(MCA) 블록을 도입하여 다양한 스케일에서 전역 및 로컬 콘텐츠 큐를 효과적으로 결합하여 복잡한 문자의 복잡한 스트로크를 더 잘 보존합니다. 또한 스타일의 큰 변화를 더 잘 관리하기 위해 스타일 대조적 개선(SCR) 모듈, 즉 스타일 표현 학습을 위한 새로운 구조를 제안합니다. 이는 스타일 추출기를 사용하여 이미지에서 스타일을 분리하고, 신중하게 설계된 스타일 대조적 손실을 통해 확산 모델을 감독합니다. 광범위한 실험을 통해 FontDiffuser는 다양한 문자와 스타일 생성에서 최첨단 성능을 보여주며, 특히 복잡한 문자와 큰 스타일 변화에서 기존 방법을 일관되게 능가함을 보여줍니다.
더 보기
AI
폰트 생성