Trainingsfreies Bildbearbeitung: Stable Flow revolutioniert das Feld

2025-01-28
Trainingsfreies Bildbearbeitung: Stable Flow revolutioniert das Feld

Stable Flow ist eine trainingsfreie Methode zur Bildbearbeitung, die das Diffusion Transformer (DiT)-Modell nutzt. Es ermöglicht verschiedene Bildbearbeitungsvorgänge, darunter nicht-starre Bearbeitung, Hinzufügen von Objekten, Entfernen von Objekten und globale Szenenbearbeitung, durch selektives Injizieren von Aufmerksamkeitsmerkmalen. Im Gegensatz zu UNet-basierten Modellen fehlt DiT eine grob-zu-fein-Synthesestruktur. Die Forscher schlagen eine automatische Methode vor, um „vitale Schichten“ innerhalb von DiT zu identifizieren, die für die Bildbildung entscheidend sind. Durch Injizieren von Merkmalen aus der generativen Trajektorie des Quellbildes in die Trajektorie des bearbeiteten Bildes ermöglicht Stable Flow konsistente und stabile Bearbeitungen. Darüber hinaus wird eine verbesserte Bildinversionsmethode für die Bearbeitung von realen Bildern eingeführt. Experimente zeigen die Effektivität von Stable Flow in verschiedenen Anwendungen.