アップル、拡散モデルに挑む:正規化フローによる画像生成のブレークスルー

2025-06-27
アップル、拡散モデルに挑む:正規化フローによる画像生成のブレークスルー

アップルは2つの論文を発表し、忘れられていた画像生成技術である正規化フローの可能性を示しました。新しいモデル、TarFlowとSTARFlowは、トランスフォーマーを活用することで、画像の品質と効率において著しい進歩を遂げています。トークン単位で画像を生成するOpenAIのGPT-4oとは異なり、アップルのモデルは画素値を直接生成するか、圧縮と解凍のプロセスを経て生成することで、トークン化による情報損失を回避し、画像の詳細をより細かく制御できます。STARFlowはさらに、潜在空間生成と軽量言語モデルの統合により、モバイルデバイスへの適性を高めています。これは画像生成分野における新たな方向性を示すものであり、拡散モデルの支配的地位に挑戦するものです。