Das verschwindende Web und das Versprechen der LLMs

2025-03-16

Das Internet vergisst langsam: Jedes Jahr verschwindet ein erheblicher Teil der Webseiten für immer. Das Internet Archive (IA) ist ein wichtiger Hüter dieses digitalen Gedächtnisses, doch sein Überleben steht vor wachsenden Herausforderungen. Der Autor argumentiert, dass die leistungsstarken Fähigkeiten von Large Language Models (LLMs), Informationen zu komprimieren, selbst bei Ungenauigkeiten, besser sind als ein vollständiger Verlust, obwohl die vollständige Erhaltung aus wirtschaftlichen Gründen nicht machbar ist. Modelle wie DeepSeek V3 bieten bereits eine komprimierte Ansicht des Internets. Wir sollten Institutionen wie IA unterstützen und sicherstellen, dass öffentlich veröffentlichte LLM-Gewichte nicht verloren gehen und dass IA Teil des Pre-Training-Datensatzes ist.