SourceHut se défend contre le scraping agressif des LLM
SourceHut, une plateforme dédiée au logiciel open source, lutte activement contre le scraping agressif des données par les grands modèles de langage (LLM). Elle affirme que les entreprises de LLM n'ont pas le droit aux données de ses utilisateurs et a explicitement déclaré qu'elle ne conclurait aucun accord de partage de données avec aucune entreprise, même moyennant rémunération. SourceHut a déployé Anubis pour protéger ses services et a mis à jour ses conditions d'utilisation pour limiter strictement le scraping des données, autorisant uniquement des utilisations telles que l'indexation des moteurs de recherche, la recherche en accès ouvert et l'archivage. Elle souligne que les données appartiennent à ses utilisateurs et que sa responsabilité est de garantir que les données sont utilisées dans le meilleur intérêt de ses utilisateurs, et non à des fins commerciales ou pour entraîner des modèles LLM.