Mistral OCR模型表现不如预期，Google Gemini 2.0领先

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

Mistral OCR模型表现不如预期，Google Gemini 2.0领先

2025-03-11

近期测试显示，Mistral新发布的OCR专用模型性能不佳，与宣传不符。开发者Willis和Doria分别指出该模型在处理复杂版面和手写内容时存在错误，例如重复城市名称、数字错误以及产生幻觉。相比之下，Google Gemini 2.0 Flash Pro Experimental表现出色，能够处理Mistral无法处理的复杂PDF文档，包括手写内容，其强大的上下文窗口也是关键优势。LLM驱动的OCR虽然前景广阔，但也存在产生错误信息、误解指令等问题。

(arstechnica.com)

后院里的致命樱桃月桂：从尼禄的毒药到土耳其的果酱

AI赋能精神医疗：Legion Health招募顶尖AI工程师