Novo modelo OCR do Mistral decepcionante; Google Gemini 2.0 assume a liderança
2025-03-11

Testes recentes mostram que o novo modelo OCR específico do Mistral não atende às suas promessas promocionais. Os desenvolvedores Willis e Doria destacaram problemas no tratamento de layouts complexos e de escrita manuscrita, incluindo repetição de nomes de cidades, erros numéricos e alucinações. Em contraste, o Google Gemini 2.0 Flash Pro Experimental se destaca, processando PDFs complexos que o Mistral não consegue, incluindo aqueles com conteúdo manuscrito. Sua grande janela de contexto é uma vantagem chave. Embora promissor, o OCR baseado em LLM sofre de problemas como fabricação de informações, interpretação incorreta de instruções e interpretação geral incorreta de dados.
IA