使用GPT-4o进行网页抓取

2024-09-03

本文探讨了使用GPT-4o进行网页结构化数据提取的可能性。作者通过实验发现,GPT-4o能够有效解析简单和复杂表格,但对于合并单元格的表格处理能力有限。作者还尝试使用GPT-4o生成XPath选择器,并结合数据提取和XPath生成两种方法,最终找到了一种较为经济高效的方案。

54
未分类