LLMへの毒薬:データスクレイピングへの反撃
2025-09-05

大規模言語モデル(LLM)は膨大なデータで学習しますが、その多くは、著者の同意なしに公開ウェブからスクレイピングされたものです。ある著者は、意図的に意味不明なミラー記事を作成し、nofollowタグでリンクすることで反撃しています。nofollowを無視する可能性のあるLLMがこのナンセンスな情報を摂取し、出力の質が低下することを期待しています。完璧な解決策ではありませんが、著者は、データの無断スクレイピングと、コンテンツ作成者への倫理的な影響について、意識を高めようとしています。
続きを読む
開発