OpenAIの新しいモデルは幻覚が多い:大きいほど良いとは限らない

2025-04-18
OpenAIの新しいモデルは幻覚が多い:大きいほど良いとは限らない

OpenAIが最近リリースしたo3とo4-miniモデルは、多くの点で最先端ですが、以前のモデルと比較して、幻覚が増えているという懸念があります。内部テストでは、以前の推論モデル(o1、o1-mini、o3-mini)やGPT-4oなどの従来の非推論モデルよりも、幻覚率が大幅に高いことが明らかになりました。OpenAIは原因を特定できていませんが、これは精度が求められる業界にとって課題となります。第三者機関によるテストでも、o3が推論プロセスで手順をでっち上げていることが確認されています。コーディングや数学では優れていますが、高い幻覚率が適用範囲を制限しています。モデルの幻覚に対処することは、AI研究の重要な分野であり、モデルにウェブ検索機能を与えることが有望なアプローチとして注目されています。

AI 幻覚