Meta y OpenAI acusadas de usar una base de datos pirata para entrenar modelos de IA

2025-03-22
Meta y OpenAI acusadas de usar una base de datos pirata para entrenar modelos de IA

Meta y OpenAI están envueltas en una controversia de derechos de autor después de que se revelara que usaron la base de datos de libros pirateada Library Genesis (LibGen) para entrenar sus modelos de IA. Para acelerar el entrenamiento de su modelo Llama 3, Meta eludió los costosos procesos de licencia y descargó directamente millones de libros y artículos académicos de LibGen. Esta acción llevó a una demanda de autores, con documentos judiciales que revelan que los empleados de Meta reconocieron los riesgos legales e intentaron encubrir sus acciones. OpenAI también admitió el uso pasado de LibGen, pero afirma que sus modelos más recientes ya no se basan en este conjunto de datos. El incidente destaca los desafíos éticos y legales en torno al origen de los datos de entrenamiento para modelos de IA y la protección de la propiedad intelectual.