Modelos de Difusão para o Prêmio ARC AGI: Uma Tarefa Surpreendentemente Difícil
2025-08-09

Esta publicação detalha uma tentativa de resolver o desafio ARC AGI usando um modelo de difusão. O autor adaptou um modelo de linguagem autorregressivo refinado em um modelo de difusão, permitindo a geração não sequencial. Embora a abordagem de difusão tenha alcançado uma precisão de pixel modestamente melhor, ela não se traduziu em taxas de sucesso de tarefa aprimoradas. O principal gargalo foi identificado como a falta de cache eficiente na arquitetura do modelo de difusão, tornando-o mais lento do que a linha de base autorregressiva. Trabalhos futuros se concentrarão em melhorar o cache e desenvolver estratégias de geração de candidatos mais eficientes.
Leia mais