搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

AI 爬虫需要更加尊重网站 (about.readthedocs.com)

文章指出 AI 爬虫对 Read the Docs 网站造成了困扰。这些爬虫疯狂抓取内容,导致网站带宽费用激增。作者列举了多个 AI 爬虫滥用案例,例如反复下载相同的大文件,消耗了大量带宽资源。作者呼吁 AI 公司约束爬虫行为,尊重网站资源,并建议他们参考 Scrapy 等工具,实现对网站友好的爬取策略。