Scandale des données d'entraînement de l'IA de Meta : des e-mails divulgués révèlent le téléchargement de 81,7 To de matériel piraté

2025-02-16
Scandale des données d'entraînement de l'IA de Meta : des e-mails divulgués révèlent le téléchargement de 81,7 To de matériel piraté

Meta fait face à un recours collectif pour violation de droits d'auteur. De nouveaux documents judiciaires non scellés révèlent des communications internes montrant que des employés de Meta ont utilisé au moins 81,7 To de données téléchargées illégalement à partir de bibliothèques shadow comme LibGen pour entraîner leurs modèles d'IA. Des e-mails révèlent que les employés ont exprimé des préoccupations éthiques et ont même utilisé des VPN pour masquer leurs adresses IP lorsqu'ils téléchargeaient et partageaient du matériel protégé par des droits d'auteur. Cela contredit les dépositions précédentes, renforçant le cas du demandeur et pouvant nuire considérablement à la défense de Meta.