Reddit封杀互联网档案馆爬虫:AI数据滥用惹的祸

2025-08-12
Reddit封杀互联网档案馆爬虫:AI数据滥用惹的祸

Reddit 发现 AI 公司正在利用互联网档案馆 Wayback Machine 爬取其数据,并违反了其平台政策。因此,Reddit 决定限制 Wayback Machine 对其大部分内容的访问,只允许其索引 Reddit 首页。此举旨在保护用户隐私,防止数据滥用用于训练 AI 模型。Reddit 此前已与 Google 达成付费数据协议,并起诉 Anthropic 公司未经授权爬取数据。这一事件凸显了 AI 数据获取的伦理困境和平台保护自身数据的挑战。