AIによるOpenAI画像生成の改善:反復的な改良実験
2025-05-21
この記事では、大規模言語モデル(LLM)を使用してOpenAI APIで生成された画像の品質を反復的に改善する実験について詳述しています。複雑なプロンプトから始めて、研究者たちは、結果として得られた画像がぼやけたテキストと弱い視覚的な魅力に悩まされていることを発見しました。2つのアプローチがテストされました。1つ目は、LLMを「審査員」として使用して、画像の欠陥を繰り返し特定して修正するというものでしたが、これはLLMが創造的なタスクと技術的なタスクを同時に処理することに苦労したため、効果がありませんでした。2つ目は、LLMを使用してぼやけたテキストの周囲にバウンディングボックスを生成し、ターゲットを絞った編集を行うというものでしたが、LLMは正確な位置特定に苦労しました。最終的に、テキストの明瞭さの向上と画像全体の品質向上を分離することで、より良い結果が得られました。
AI