本文作者对使用 GPT-4o 进行网页信息提取的成本优化进行了研究。研究发现,去除 HTML 标签并仅使用纯文本数据可以有效降低成本,且对 GPT-4o 的准确率影响甚微。作者建议在进行数据提取任务时,根据具体情况选择 GPT-4o 或其精简版,并尽可能去除 HTML 标签以降低成本。