La saisie de données par l'IA : la guerre contre l'accès ouvert

2025-03-25
La saisie de données par l'IA : la guerre contre l'accès ouvert

Une guerre fait rage sur internet. Des entreprises d'IA disposant de milliards de dollars raclent agressivement des données provenant de bibliothèques, d'archives, d'organisations à but non lucratif et d'éditeurs universitaires, alimentant l'entraînement de grands modèles de langage (LLM). Ces institutions, qui se consacrent à la mise à disposition universelle d'informations de qualité, ripostent, mais la soif insatiable des entreprises d'IA pour les données est écrasante. Ignorant les robots.txt et les directives nofollow, ces robots surchargent les serveurs, paralysant les sites web. Cela gaspille le temps et les ressources des développeurs et menace la préservation des informations culturelles et scientifiques. Le résultat final pourrait être un monde où les informations de qualité sont enfermées derrière des paywalls, accessibles uniquement à une poignée de privilégiés.