OpenAI의 새로운 모델, 환각이 더 심각: 크다고 좋은 것은 아니다

2025-04-18
OpenAI의 새로운 모델, 환각이 더 심각: 크다고 좋은 것은 아니다

OpenAI가 최근 출시한 o3 및 o4-mini 모델은 여러 면에서 최첨단이지만, 이전 모델에 비해 환각 현상이 우려스럽게 증가했습니다. 내부 테스트 결과 이전 추론 모델(o1, o1-mini, o3-mini)이나 GPT-4o와 같은 기존 비추론 모델보다 환각률이 훨씬 높은 것으로 나타났습니다. OpenAI는 그 원인을 아직 파악하지 못했지만, 정확성이 요구되는 산업 분야에는 과제가 됩니다. 제3자 테스트에서도 o3이 추론 과정에서 단계를 조작하는 것이 확인되었습니다. 코딩과 수학에서는 뛰어나지만, 높은 환각률로 인해 적용 범위가 제한됩니다. 모델의 환각 문제 해결은 AI 연구의 중요한 분야이며, 모델에 웹 검색 기능을 제공하는 것이 유망한 접근 방식으로 주목받고 있습니다.

AI 환각