SourceHut combate a raspagem agressiva de LLMs
O SourceHut, uma plataforma dedicada a servir software de código aberto, está combatendo ativamente a raspagem agressiva de dados por modelos de linguagem grandes (LLMs). Eles argumentam que as empresas de LLM não têm direito aos dados de seus usuários e declararam explicitamente que não farão acordos de compartilhamento de dados com nenhuma empresa, mesmo que sejam pagos. O SourceHut implantou o Anubis para proteger seus serviços e atualizou seus termos de serviço para limitar estritamente a raspagem de dados, permitindo apenas usos como indexação de mecanismos de busca, pesquisa de acesso aberto e arquivamento. Eles enfatizam que os dados pertencem aos seus usuários e sua responsabilidade é garantir que os dados sejam usados no melhor interesse de seus usuários, não para lucro comercial ou treinamento de modelos de LLM.