用AI提升OpenAI图像生成质量:一次迭代改进实验
2025-05-21
本文讲述了利用大型语言模型(LLM)迭代改进OpenAI API生成的图像质量的尝试。首先,研究者使用一个复杂的提示生成初始图像,发现生成的图像存在文本模糊、视觉吸引力不足等问题。他们尝试了两种方法:第一种方法是利用LLM作为“评判者”,识别图像缺陷并迭代修复,但效果不佳,因为LLM难以同时处理创造性和技术性任务。第二种方法是利用LLM生成文本模糊区域的边界框,再用边界框作为掩码进行图像编辑,但LLM在精准定位方面表现欠佳。最终,研究者发现将文本清晰度修复和图像整体质量提升分开处理,效果更好。
AI