LLM de Difusión: Un cambio de paradigma en el modelado del lenguaje

2025-03-06

Inception Labs ha presentado un revolucionario Modelo de Lenguaje Grande de Difusión (dLLM) que desafía el enfoque autorregresivo tradicional. A diferencia de los modelos autorregresivos que predicen tokens secuencialmente, los dLLMs generan segmentos de texto simultáneamente, refinándolos iterativamente. Este método, exitoso en modelos de imagen y video, ahora supera a los LLM de tamaño similar en la generación de código, con una mejora de 5 a 10 veces en velocidad y eficiencia. La principal ventaja: reducción de alucinaciones. Los dLLMs generan y validan partes cruciales antes de continuar, crucial para aplicaciones que requieren precisión, como chatbots y agentes inteligentes. Este enfoque promete flujos de trabajo de agentes multietapa mejorados, previniendo bucles y mejorando la planificación, el razonamiento y la autocorrección.

IA