نيفينثيس: مصيدة لمُجَمِّعات صفحات الويب
2025-01-16
نيفينثيس أداة مصممة لاصطياد مُجَمِّعات صفحات الويب، خاصة تلك التي تجمع البيانات لأنظمة معالجة اللغات الكبيرة (LLMs). وهي تُولِّد سلسلة لا نهائية من الصفحات، كل صفحة بها عشرات الروابط التي تُعيد المُجَمِّع إلى المصيدة. الصفحات مُولَّدة عشوائيًا، لكن بطريقة حتمية، تبدو وكأنها ملفات ثابتة لا تتغير. تُضيف نيفينثيس تأخيرات متعمدة لمنع مُجَمِّعات الصفحات من إبطاء الخادم، وإضاعة وقتهم. ويمكن إضافة ميزة توليد نصوص عشوائية (ماركوف) اختيارية، مما يمنح المُجَمِّعات بيانات من أجل تسريع انهيار النموذج، حسب الأرجح. تحذير: هذه الأداة تستهلك كمية كبيرة من موارد وحدة المعالجة المركزية، خاصةً عند تمكين وحدة ماركوف. استخدمها بحذر.
اقرأ المزيد
التطوير
مكافحة المُجَمِّعات