GitHub - getomni-ai/zerox:基于 GPT-4o-mini 的零样本 PDF OCR

2024-07-23

Zerox 是一款简单易用的 OCR 工具,利用 GPT-4o-mini 模型对 PDF 文档进行高质量识别。该工具将 PDF 转换为图像序列,并利用 GPT 模型将其转换为 Markdown 格式,具有高准确率和价格竞争力。与 AWS Textract、Google Document AI 等现有产品相比,Zerox 在处理包含表格、图表等复杂布局的文档时表现出色。

39
未分类