SourceHut lucha contra el raspado agresivo de LLM
SourceHut, una plataforma dedicada a servir software de código abierto, está luchando activamente contra el raspado agresivo de datos por modelos de lenguaje grandes (LLMs). Argumentan que las empresas de LLM no tienen derecho a los datos de sus usuarios y han declarado explícitamente que no harán acuerdos de intercambio de datos con ninguna empresa, incluso si se les paga. SourceHut ha implementado Anubis para proteger sus servicios y ha actualizado sus términos de servicio para limitar estrictamente el raspado de datos, permitiendo solo usos como la indexación de motores de búsqueda, la investigación de acceso abierto y el archivo. Destacan que los datos pertenecen a sus usuarios y su responsabilidad es garantizar que los datos se utilicen en el mejor interés de sus usuarios, no para fines comerciales o para entrenar modelos de LLM.