Modelos de difusión para el premio ARC AGI: una tarea sorprendentemente difícil

2025-08-09
Modelos de difusión para el premio ARC AGI: una tarea sorprendentemente difícil

Esta publicación detalla un intento de resolver el desafío ARC AGI utilizando un modelo de difusión. El autor adaptó un modelo de lenguaje autorregresivo afinado a un modelo de difusión, permitiendo la generación no secuencial. Si bien el enfoque de difusión logró una precisión de píxel ligeramente mejor, no se tradujo en tasas de éxito de tareas mejoradas. El principal cuello de botella se identificó como la falta de almacenamiento en caché eficiente en la arquitectura del modelo de difusión, lo que lo hace más lento que la línea de base autorregresiva. El trabajo futuro se centrará en mejorar el almacenamiento en caché y desarrollar estrategias de generación de candidatos más eficientes.