Melhorando a Geração de Imagens do OpenAI com IA: Um Experimento de Refinamento Iterativo

2025-05-21

Este artigo descreve um experimento usando Modelos de Linguagem Grandes (LLMs) para melhorar iterativamente a qualidade das imagens geradas pela API do OpenAI. Começando com um prompt complexo, os pesquisadores descobriram que as imagens resultantes apresentavam texto borrado e apelo visual fraco. Duas abordagens foram testadas: Primeiro, usando um LLM como um 'juiz' para identificar e corrigir iterativamente falhas na imagem, mas isso se mostrou ineficaz, pois o LLM teve dificuldades em lidar simultaneamente com tarefas criativas e técnicas. Segundo, usando o LLM para gerar caixas delimitadoras em torno de texto borrado para edição direcionada, mas o LLM teve dificuldades com localização precisa. Por fim, separar a melhoria da clareza do texto do aprimoramento da qualidade geral da imagem produziu melhores resultados.