A Infraestrutura da Wikimedia sob Ataque: O Tsunami de Raspagem de Dados de IA

2025-05-02
A Infraestrutura da Wikimedia sob Ataque: O Tsunami de Raspagem de Dados de IA

Desde o início de 2024, a demanda pelo conteúdo da Wikimedia, especialmente os 144 milhões de imagens e arquivos no Wikimedia Commons, aumentou drasticamente. Esse aumento é impulsionado por modelos de IA que treinam em dados abertos, levando a um aumento de 50% no uso da largura de banda por bots de raspagem. Essa carga sem precedentes sobrecarrega a infraestrutura da Wikimedia, causando lentidão e aumento de custos. Impressionantes 65% do tráfego caro são provenientes de bots, desproporcional à sua participação de 35% nas visualizações de página gerais. A Wikimedia pede uso responsável de dados, incentivando os desenvolvedores a usar canais de acesso suportados para garantir a sustentabilidade de seus recursos de conhecimento gratuitos.

Tecnologia