Meta e OpenAI acusadas de usar banco de dados pirata para treinar modelos de IA

2025-03-22
Meta e OpenAI acusadas de usar banco de dados pirata para treinar modelos de IA

Meta e OpenAI estão envolvidas em uma polêmica de direitos autorais após ser revelado que usaram o banco de dados de livros piratas Library Genesis (LibGen) para treinar seus modelos de IA. Para acelerar o treinamento de seu modelo Llama 3, o Meta contornou os processos de licenciamento caros e baixou diretamente milhões de livros e artigos científicos do LibGen. Essa ação levou a um processo judicial de autores, com documentos judiciais revelando que os funcionários do Meta reconheceram os riscos legais e tentaram encobrir suas ações. A OpenAI também admitiu o uso passado do LibGen, mas afirma que seus modelos mais recentes não dependem mais desse conjunto de dados. O incidente destaca os desafios éticos e legais em torno da origem dos dados de treinamento para modelos de IA e a proteção da propriedade intelectual.