Modelos de Difusión: Los Héroes No Reconocidos de la Generación de Imágenes con IA

2025-05-19

A diferencia de los modelos de lenguaje basados en transformadores, los modelos de difusión generan imágenes eliminando ruido progresivamente de una imagen ruidosa. El entrenamiento implica enseñar al modelo a identificar el ruido añadido, permitiéndole generar imágenes a partir de ruido puro. Esto es similar a la escultura, refinando gradualmente un bloque áspero de piedra en una obra maestra. Aunque todavía está en fase inicial para texto, los modelos de difusion muestran una gran promesa en la generación de imágenes y videos, como se ve en Sora de OpenAI y VEO de Google. El núcleo reside en cómo modela la relación entre ruido y datos, un contraste marcado con el enfoque de los transformadores en la estructura del lenguaje.

IA