FontDiffuser:基于扩散模型的字体生成新突破
FontDiffuser是一种新颖的基于扩散模型的字体生成方法,它将字体模仿任务建模为一个噪声到去噪范式。为了解决现有方法在处理复杂字符和较大风格变化方面的不足,FontDiffuser引入了多尺度内容聚合(MCA)模块,有效结合不同尺度的全局和局部内容线索,从而更好地保留复杂字符的细微笔画。此外,它还提出了风格对比细化(SCR)模块,利用风格提取器解耦图像中的风格,并通过精心设计的风格对比损失来监督扩散模型,从而更好地管理风格迁移中的巨大差异。实验结果表明,FontDiffuser在生成多样化字符和风格方面取得了最先进的性能,尤其在处理复杂字符和较大风格变化方面显著优于现有方法。
阅读更多