Apple Desafia Modelos de Difusão: Uma Nova Proposta em Geração de Imagens com Fluxos Normalizadores

2025-06-27
Apple Desafia Modelos de Difusão: Uma Nova Proposta em Geração de Imagens com Fluxos Normalizadores

A Apple publicou dois artigos que demonstram o potencial de uma técnica esquecida de geração de imagens: Fluxos Normalizadores. Seus novos modelos, TarFlow e STARFlow, utilizam Transformadores para alcançar avanços significativos na qualidade e eficiência da imagem. Ao contrário do GPT-4o da OpenAI, que gera imagens token por token, os modelos da Apple geram valores de pixels diretamente ou por meio de um processo de compressão-descompressão, evitando a perda de informações da tokenização e oferecendo melhor controle sobre os detalhes da imagem. O STARFlow vai além, empregando geração de espaço latente e integrando um modelo de linguagem leve, tornando-o mais adequado para dispositivos móveis. Isso marca uma nova direção na geração de imagens, desafiando a dominância dos modelos de difusão.