Mistral OCR模型表现不如预期,Google Gemini 2.0领先

2025-03-11
Mistral OCR模型表现不如预期,Google Gemini 2.0领先

近期测试显示,Mistral新发布的OCR专用模型性能不佳,与宣传不符。开发者Willis和Doria分别指出该模型在处理复杂版面和手写内容时存在错误,例如重复城市名称、数字错误以及产生幻觉。相比之下,Google Gemini 2.0 Flash Pro Experimental表现出色,能够处理Mistral无法处理的复杂PDF文档,包括手写内容,其强大的上下文窗口也是关键优势。LLM驱动的OCR虽然前景广阔,但也存在产生错误信息、误解指令等问题。

AI