QB64 搜索技巧 核手提箱 文字记录 海洋云增白 开源地图 Bliss AI 搜索答案 深海沉船 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 世界 PostgreSQL AI工具 证券 DirectX 防溢 DrawingPics Zulip 儿童读物 化学 连续滚动 代码审查 三菱电机 更多

AI 爬虫需要更加尊重网站 (about.readthedocs.com)

文章指出 AI 爬虫对 Read the Docs 网站造成了困扰。这些爬虫疯狂抓取内容,导致网站带宽费用激增。作者列举了多个 AI 爬虫滥用案例,例如反复下载相同的大文件,消耗了大量带宽资源。作者呼吁 AI 公司约束爬虫行为,尊重网站资源,并建议他们参考 Scrapy 等工具,实现对网站友好的爬取策略。

评论已经关闭!