扩散模型:AI图像生成的幕后推手
2025-05-19
与基于Transformer的语言模型不同,扩散模型通过将图像转化为噪声,再逐步去除噪声来生成图像。训练过程中,模型学习识别添加到图像中的噪声,最终能够从纯噪声中生成图像。这一过程类似于雕塑,从一块粗糙的石头逐步打磨成精美的作品。虽然目前文本扩散模型尚不成熟,但其在图像和视频生成领域已展现出强大的潜力,例如OpenAI的Sora和Google的VEO。扩散模型的核心在于其对噪声和数据之间关系的建模,这与Transformer模型对语言结构的建模截然不同。
AI