TarFlow: Fluxos Normalizadores baseados em Transformer alcançam SOTA em Estimação de Probabilidade de Imagem

Pesquisadores apresentam TarFlow, um novo modelo de fluxo normalizador que utiliza Transformers e fluxos autorregressivos mascarados. O TarFlow estima densidade e gera imagens de forma eficiente, processando patches de imagens com blocos de Transformer autorregressivos, alternando a direção da autorregressão entre as camadas. Três técnicas-chave melhoram a qualidade das amostras: aumento de ruído gaussiano durante o treinamento, processo de desruído pós-treinamento e um método de orientação eficaz para geração condicional e incondicional de classes. O TarFlow alcança resultados de ponta na estimação de probabilidade de imagens, superando significativamente os métodos anteriores e gerando amostras com qualidade e diversidade comparáveis a modelos de difusão — uma primeira vez para um modelo de fluxo normalizador autônomo.