Wikimedias Infrastruktur unter Beschuss: Der Tsunami des KI-Daten-Scrapings

2025-05-02
Wikimedias Infrastruktur unter Beschuss: Der Tsunami des KI-Daten-Scrapings

Seit Anfang 2024 ist die Nachfrage nach Wikimedias Inhalten, insbesondere den 144 Millionen Bildern und Dateien auf Wikimedia Commons, stark gestiegen. Dieser Anstieg wird durch KI-Modelle angetrieben, die mit offenen Daten trainiert werden, was zu einem Anstieg der Bandbreitennutzung durch Scraping-Bots um 50 % führt. Diese beispiellose Belastung belastet die Infrastruktur von Wikimedia, verursacht Verlangsamungen und steigende Kosten. Erstaunlicherweise stammen 65 % des teuren Datenverkehrs von Bots, was im Missverhältnis zu ihrem Anteil von 35 % an den gesamten Seitenaufrufen steht. Wikimedia appelliert an eine verantwortungsvolle Datennutzung und fordert Entwickler auf, unterstützte Zugangskanäle zu nutzen, um die Nachhaltigkeit seiner kostenlosen Wissensressourcen zu gewährleisten.

Mehr lesen
Technologie