TarFlow: Flujos Normalizadores basados en Transformer alcanzan el estado del arte en la estimación de verosimilitud de imágenes
Los investigadores presentan TarFlow, un nuevo modelo de flujo normalizador que aprovecha los Transformers y los flujos autorregresivos enmascarados. TarFlow estima la densidad y genera imágenes de manera eficiente procesando parches de imágenes con bloques de Transformer autorregresivos, alternando la dirección de la autorregresión entre capas. Tres técnicas clave mejoran la calidad de las muestras: aumento de ruido gaussiano durante el entrenamiento, un procedimiento de eliminación de ruido posterior al entrenamiento y un método de guía eficaz tanto para configuraciones condicionales como incondicionales de clases. TarFlow alcanza resultados de vanguardia en la estimación de verosimilitud de imágenes, superando significativamente a los métodos anteriores y generando muestras con una calidad y diversidad comparables a los modelos de difusión, por primera vez con un modelo de flujo normalizador independiente.