La Web que Desaparece y la Promesa de los LLMs

2025-03-16

Internet está olvidando lentamente: cada año, una parte significativa de las páginas web desaparece para siempre. El Internet Archive (IA) es un guardián crucial de esta memoria digital, pero su supervivencia enfrenta desafíos crecientes. El autor argumenta que, si bien preservar todo es económicamente inviable, las poderosas capacidades de compresión de información de los Modelos de Lenguaje Grandes (LLMs), a pesar de las imprecisiones, son mejores que la pérdida completa. Modelos como DeepSeek V3 ya ofrecen una vista comprimida de internet. Debemos apoyar instituciones como IA y asegurarnos de que los pesos de los LLMs publicados públicamente no se pierdan, y que IA forme parte de los conjuntos de datos de preentrenamiento de los LLMs.