Webtagr - テクノロジーニュースダイジェスト

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

LLMへの毒薬：データスクレイピングへの反撃

2025-09-05

大規模言語モデル（LLM）は膨大なデータで学習しますが、その多くは、著者の同意なしに公開ウェブからスクレイピングされたものです。ある著者は、意図的に意味不明なミラー記事を作成し、nofollowタグでリンクすることで反撃しています。nofollowを無視する可能性のあるLLMがこのナンセンスな情報を摂取し、出力の質が低下することを期待しています。完璧な解決策ではありませんが、著者は、データの無断スクレイピングと、コンテンツ作成者への倫理的な影響について、意識を高めようとしています。

(heydonworks.com)

開発