AI를 활용한 OpenAI 이미지 생성 개선: 반복적 개선 실험

인기 태그：

가상화 DNS 보안 형식적 검증 도달 가능성 분석 C언어 경제 컴파일러 오류 매크로 충돌 웹 확장 기능 개발 프레임워크 모든 태그

2025-05-21

이 글에서는 대규모 언어 모델(LLM)을 사용하여 OpenAI API로 생성된 이미지의 품질을 반복적으로 개선하는 실험에 대해 자세히 설명합니다. 복잡한 프롬프트로 시작하여 연구자들은 결과 이미지가 흐릿한 텍스트와 낮은 시각적 매력으로 어려움을 겪고 있음을 발견했습니다. 두 가지 접근 방식을 테스트했습니다. 첫 번째는 LLM을 '심사위원'으로 사용하여 이미지 결함을 반복적으로 식별하고 수정하는 것이었지만, LLM이 창의적인 작업과 기술적인 작업을 동시에 처리하는 데 어려움을 겪었기 때문에 효과적이지 않았습니다. 두 번째는 LLM을 사용하여 흐릿한 텍스트 주변에 바운딩 박스를 생성하고 타겟팅된 편집을 수행하는 것이었지만, LLM은 정확한 위치 파악에 어려움을 겪었습니다. 최종적으로 텍스트 선명도 개선과 전반적인 이미지 품질 개선을 분리함으로써 더 나은 결과를 얻었습니다.