El modelo Llama 3.1 de Meta memoriza partes significativas de libros con derechos de autor

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

2025-06-15

Una nueva investigación revela que el modelo de lenguaje grande Llama 3.1 70B de Meta memorizó sorprendentemente grandes partes de libros con derechos de autor, memorizando el 42% de Harry Potter y la Piedra Filosofal. Esto es significativamente mayor que su predecesor, Llama 1 65B, lo que genera serias preocupaciones sobre derechos de autor. Los investigadores evaluaron de manera eficiente la 'memorización' del modelo calculando la probabilidad de generar secuencias de texto específicas, en lugar de generar un gran volumen de texto. Este hallazgo podría impactar significativamente los litigios sobre derechos de autor contra Meta y podría llevar a los tribunales a reconsiderar los límites del uso justo en el entrenamiento de modelos de IA. Si bien el modelo memorizó menos libros oscuros, la memorización excesiva de libros populares destaca los desafíos de los modelos de lenguaje grandes con respecto a las cuestiones de derechos de autor.