利用 OpenAI 的结构化输出功能提取财务披露报告和报纸警方记录信息

2024-10-14

这篇文章介绍了如何使用 OpenAI 的 gpt-4o-mini 模型,通过提供文档截图的 URL,并根据用户定义的模式提取数据。文章以国会财务披露报告和报纸警方记录为例,展示了如何定义数据模型并使用 Python SDK 和 pydantic 库进行数据提取。结果表明,即使在定义数据方面几乎没有做出努力,也没有进行数据准备的情况下,结果也相当可靠。

未分类