表征对齐:训练扩散 Transformer 比你想象的更容易

2024-10-14

这篇论文介绍了REPA,一种用于训练扩散 Transformer 的新方法,通过将预训练的自监督视觉表征提取到扩散 Transformer 中,可以显著提高模型的训练效率和生成质量。实验结果表明,REPA 可以使模型收敛速度提高17.5倍,并在更少的训练步骤下获得更好的生成效果。

22
未分类