FontDiffuser : une avancée dans la génération de polices basée sur la diffusion
FontDiffuser est une nouvelle méthode basée sur la diffusion pour la génération de polices one-shot, qui cadre l'imitation de polices comme un processus de bruit à débruitage. Pour répondre aux limites des méthodes existantes avec des caractères complexes et de grandes variations de style, FontDiffuser introduit un bloc d'agrégation de contenu multi-échelles (MCA) pour combiner efficacement les indices de contenu globaux et locaux à différentes échelles, préservant ainsi les traits complexes. De plus, un module de raffinement contrastif de style (SCR), une nouvelle structure d'apprentissage de représentation de style, utilise un extracteur de style pour démêler les styles et supervise le modèle de diffusion avec une perte contrastive de style. De nombreuses expériences démontrent les performances de pointe de FontDiffuser, en particulier avec des caractères complexes et des changements de style importants.