Edición de imágenes sin entrenamiento: Stable Flow revoluciona el campo
Stable Flow es un método de edición de imágenes sin entrenamiento que aprovecha el modelo Diffusion Transformer (DiT). Logra diversas operaciones de edición de imágenes, incluyendo edición no rígida, adición de objetos, eliminación de objetos y edición de escenas globales, mediante la inyección selectiva de características de atención. A diferencia de los modelos basados en UNet, DiT carece de una estructura de síntesis de grueso a fino. Los investigadores proponen un método automático para identificar las "capas vitales" cruciales para la formación de la imagen dentro de DiT. Al inyectar características de la trayectoria generativa de la imagen de origen en la trayectoria de la imagen editada, Stable Flow permite ediciones consistentes y estables. Además, introduce un método mejorado de inversión de imagen para la edición de imágenes reales. Los experimentos demuestran la eficacia de Stable Flow en diversas aplicaciones.