OpenAI 和 Anthropic 忽视阻止机器人抓取网络内容的规则

OpenAI 和 Anthropic 忽视阻止机器人抓取网络内容的规则 (www.businessinsider.com)

原文: OpenAI, Anthropic Ignore Rule That Prevents Bots Scraping Web Content - Business Insider

据报道，全球最大的两家 AI 初创公司 OpenAI 和 Anthropic 被发现无视媒体出版商停止抓取其网络内容以获取免费模型训练数据的请求。这两家公司被发现无视或绕过了一项名为 robots.txt 的既定网络规则，该规则旨在阻止自动抓取网站内容。 robots.txt 是一段自 20 世纪 90 年代后期以来一直被使用的代码，网站可以通过它告诉机器人爬虫，它们不希望自己的数据被抓取和收集。

数据抓取

上一篇: 夜间卧室灯光污染增加全身炎症并扰乱炎症标志物的昼夜节律

下一篇: 训练AI

评论已经关闭！

返回首页