开源大模型OCR和数据提取基准测试工具

热门标签：

Mac 多显示器显示器扩展 requests patch 并发 Alpine Linux BSD Linux 电动汽车全部标签

开源大模型OCR和数据提取基准测试工具

2025-04-01

一个名为Omni的开源基准测试工具横空出世，它对GPT-4o等多种大型多模态模型的OCR和数据提取能力进行了全面对比，评估了文本和JSON提取的准确性。该工具使用开源评估数据集和方法，并鼓励扩展到更多提供商。测试涵盖了从文档到OCR再到提取的全过程，并采用修改后的json-diff计算JSON提取精度，同时使用Levenshtein距离衡量文本相似度。支持多种模型，包括OpenAI、Google Gemini、Anthropic等，用户可通过简单的命令行操作运行测试，结果将保存为JSON文件。

(github.com)

开发

不起眼的小硅胶干燥剂：全球供应链的幕后英雄

超越技术债：企业各种“债务”的反思