开源大模型OCR和数据提取基准测试工具
2025-04-01
一个名为Omni的开源基准测试工具横空出世,它对GPT-4o等多种大型多模态模型的OCR和数据提取能力进行了全面对比,评估了文本和JSON提取的准确性。该工具使用开源评估数据集和方法,并鼓励扩展到更多提供商。测试涵盖了从文档到OCR再到提取的全过程,并采用修改后的json-diff计算JSON提取精度,同时使用Levenshtein距离衡量文本相似度。支持多种模型,包括OpenAI、Google Gemini、Anthropic等,用户可通过简单的命令行操作运行测试,结果将保存为JSON文件。
开发