苹果挑战扩散模型:基于Normalizing Flows的图像生成新突破

2025-06-27
苹果挑战扩散模型:基于Normalizing Flows的图像生成新突破

苹果发布两篇论文,展示了一种被遗忘的图像生成技术——Normalizing Flows的潜力。通过结合Transformer,其新模型TarFlow和STARFlow在图像质量和效率上取得了显著进展。不同于OpenAI的GPT-4o基于离散token的生成方式,Apple的模型直接生成像素值或先压缩再解码,避免了token化带来的信息损失,并能更好地控制图像细节。STARFlow更进一步,采用潜空间生成,并整合了轻量级语言模型,使其更适用于移动设备。这标志着图像生成领域一个新的方向,挑战了扩散模型的统治地位。