FontDiffuser: Ein Durchbruch in der diffusionsbasierten Schriftartengenerierung
FontDiffuser ist eine neuartige diffusionsbasierte Methode zur One-Shot-Generierung von Schriftarten, die die Schriftartenimitation als Noise-to-Denoise-Paradigma modelliert. Um die Einschränkungen bestehender Methoden bei komplexen Zeichen und großen Stilvariationen zu beheben, führt FontDiffuser einen Multi-Scale Content Aggregation (MCA)-Block ein, der globale und lokale Inhaltshinweise über verschiedene Skalen effektiv kombiniert und so die Erhaltung komplexer Striche verbessert. Darüber hinaus wird ein Style Contrastive Refinement (SCR)-Modul vorgeschlagen, eine neuartige Struktur für das Erlernen von Stilrepräsentationen. Es nutzt einen Style-Extraktor, um Stile aus Bildern zu entwirren, und überwacht das Diffusionsmodell anschließend über einen sorgfältig entworfenen Style-Contrastive-Loss. Umfangreiche Experimente zeigen die State-of-the-Art-Leistung von FontDiffuser bei der Generierung verschiedener Zeichen und Stile. Es übertrifft bestehende Methoden konsistent bei komplexen Zeichen und großen Stiländerungen.