Novos modelos da OpenAI apresentam mais alucinações: maior não é sempre melhor

Os modelos o3 e o4-mini, recentemente lançados pela OpenAI, embora estejam na vanguarda em muitos aspectos, apresentam um aumento preocupante em alucinações em comparação com seus antecessores. Testes internos revelam taxas de alucinação significativamente maiores do que os modelos de raciocínio anteriores (o1, o1-mini e o3-mini) e até mesmo modelos não-raciocínio tradicionais como o GPT-4o. A OpenAI não tem certeza da causa, o que representa um desafio para os setores que exigem precisão. Testes de terceiros confirmam esse problema, com o o3 fabricando etapas em seu processo de raciocínio. Embora se destaque em codificação e matemática, a maior taxa de alucinação limita a aplicabilidade. Abordar as alucinações do modelo é uma área fundamental da pesquisa em IA, com a concessão de recursos de pesquisa na web aos modelos emergindo como uma abordagem promissora.