La infraestructura de Wikimedia bajo asedio: el tsunami de raspado de datos de IA

2025-05-02
La infraestructura de Wikimedia bajo asedio: el tsunami de raspado de datos de IA

Desde principios de 2024, la demanda de contenido de Wikimedia, particularmente las 144 millones de imágenes y archivos en Wikimedia Commons, se ha disparado. Este aumento está impulsado por modelos de IA que entrenan con datos abiertos, lo que lleva a un aumento del 50% en el uso del ancho de banda por parte de bots de raspado. Esta carga sin precedentes sobrecarga la infraestructura de Wikimedia, causando ralentizaciones y un aumento de los costos. Un impactante 65% del tráfico costoso proviene de bots, desproporcionado a su participación del 35% en las vistas de página generales. Wikimedia solicita un uso responsable de los datos, instando a los desarrolladores a utilizar canales de acceso admitidos para garantizar la sostenibilidad de sus recursos de conocimiento gratuitos.

Leer más
Tecnología