Meissonic:复兴掩码生成式Transformer,实现高效的高分辨率文本到图像合成

2024-10-14

Meissonic是一种新的文本到图像合成模型,它改进了非自回归掩码图像建模 (MIM),实现了与SDXL等顶级扩散模型相媲美的性能。Meissonic采用了一系列架构创新、先进的位置编码策略和优化的采样条件,显著提升了MIM的性能和效率,并通过高质量的训练数据、结合人类偏好分数的微调以及特征压缩层,进一步增强了图像的保真度和分辨率。

27