Documind:基于AI的开源文档结构化数据提取平台

2024-11-18

Documind是一个利用AI从PDF文档中提取结构化数据的开源平台。它能够将PDF转换为图像,使用OpenAI的API提取信息,并根据自定义模式格式化结果。用户可以定义提取模式以处理不同格式的文档。Documind支持本地和云端部署,即将推出托管版本,提供更便捷的使用体验。使用前需要安装Ghostscript、GraphicsMagick、Node.js和NPM等依赖,并设置环境变量。

未分类 PDF提取