Modelos de Difusão: Os Heróis Anônimos da Geração de Imagens de IA

2025-05-19

Diferentemente dos modelos de linguagem baseados em transformadores, os modelos de difusão geram imagens removendo progressivamente ruído de uma imagem ruidosa. O treinamento envolve ensinar o modelo a identificar o ruído adicionado, permitindo que ele gere imagens a partir de ruído puro. Isso é semelhante à escultura, refinando gradualmente um bloco áspero de pedra em uma obra-prima. Embora ainda esteja em fase inicial para texto, os modelos de difusão mostram grande promessa na geração de imagens e vídeos, como visto no Sora da OpenAI e no VEO do Google. O núcleo reside em como ele modela a relação entre ruído e dados, um contraste acentuado com o foco dos transformadores na estrutura da linguagem.

IA