AIによるデータ略奪:オープンアクセスへの戦い
2025-03-25

インターネット上で戦争が勃発している。数十億ドルを投じるAI企業が、図書館、アーカイブ、非営利団体、学術出版社のウェブサイトからデータを貪欲に収集し、大規模言語モデル(LLM)のトレーニングに利用している。質の高い情報を世界中に普遍的に提供することに尽力するこれらの機関は反撃しているが、AI企業のデータへの飽くなき渇きは圧倒的だ。robots.txtやnofollowディレクティブを無視し、これらのボットはサーバーを過負荷にし、ウェブサイトを機能不全に陥れる。これにより、開発者の時間とリソースが無駄になり、文化的および科学的情報の保存が脅かされる。最終的な結果として、質の高い情報がペイウォールの後ろに閉じ込められ、特権的な少数の者だけがアクセスできる世界になる可能性がある。
続きを読む
テクノロジー