الويب المتلاشى ووعود نماذج اللغات الكبيرة
2025-03-16
ينسى الإنترنت ببطء: في كل عام، يختفي جزء كبير من صفحات الويب إلى الأبد. يمثل أرشيف الإنترنت (IA) حارسًا بالغ الأهمية لهذه الذاكرة الرقمية، لكن بقاءه يواجه تحديات متزايدة. يجادل الكاتب بأنه على الرغم من أن الحفاظ على كل شيء غير ممكن اقتصاديًا، فإن قدرات نماذج اللغات الكبيرة (LLMs) القوية في ضغط المعلومات، حتى مع وجود عدم دقة، أفضل من الفقدان الكامل. تقدم نماذج مثل DeepSeek V3 بالفعل عرضًا مضغوطًا للإنترنت. يجب علينا دعم مؤسسات مثل IA والتأكد من عدم فقدان أوزان LLMs المنشورة علنًا، وأن يكون IA جزءًا من مجموعات بيانات التدريب المسبق لـ LLMs.
التكنولوجيا
حفظ المعلومات