Édition d'images sans entraînement : Stable Flow révolutionne le domaine

2025-01-28
Édition d'images sans entraînement : Stable Flow révolutionne le domaine

Stable Flow est une méthode d'édition d'images sans entraînement qui exploite le modèle Diffusion Transformer (DiT). Elle permet de réaliser diverses opérations d'édition d'images, notamment l'édition non rigide, l'ajout d'objets, la suppression d'objets et l'édition de scènes globales, en injectant sélectivement des caractéristiques d'attention. Contrairement aux modèles basés sur UNet, DiT ne possède pas de structure de synthèse grossière à fine. Les chercheurs proposent une méthode automatique pour identifier les « couches vitales » cruciales pour la formation de l'image au sein de DiT. En injectant des caractéristiques de la trajectoire génératrice de l'image source dans la trajectoire de l'image éditée, Stable Flow permet des éditions cohérentes et stables. De plus, il introduit une méthode améliorée d'inversion d'image pour l'édition d'images réelles. Les expériences démontrent l'efficacité de Stable Flow dans diverses applications.