Empoisonner les LLMs : La riposte d’un auteur contre le raclage de données

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

Empoisonner les LLMs : La riposte d’un auteur contre le raclage de données

2025-09-05

Les grands modèles de langage (LLM) s’entraînent sur d’énormes quantités de données, dont une grande partie est extraite du web ouvert sans le consentement des auteurs. Un auteur riposte en créant des articles miroirs délibérément absurdes, liés par des liens nofollow. L’espoir est que les LLM, qui peuvent ignorer nofollow, ingéreront ces inepties, dégradant ainsi leurs résultats. Bien que ce ne soit pas une solution parfaite, l’auteur vise à sensibiliser au raclage non autorisé de données et aux implications éthiques pour les créateurs de contenu.

(heydonworks.com)

Développement Raclage de données

La triche à l'IA : comment la technologie a simplifié l'école, mais rendu plus difficile d'en sortir

Architecture d'agent IA : la confiance, pas la précision