Marginalia搜索引擎:升级后的在线状态和所有权变更检测系统
Marginalia搜索引擎团队开发了一个新系统“ping-process”,用于检测服务器在线状态和网站重大变更(包括所有权变更和域名停放)。该系统主要依靠HTTP HEAD请求和DNS查询,通过分析证书细节、安全姿态、服务器头部等信息来识别变更。数据存储在“快照表”和“事件表”中,前者存储最新信息,后者存储历史事件。系统克服了调度和证书验证等挑战,初步成功识别大量域名停放事件,未来将进一步完善所有权变更检测模型,并应用于爬虫策略优化。
阅读更多