传统的网络应用程序爬取和解析方法主要依赖于从初始页面提取超链接并递归地跟踪链接资源,构建以网页非结构化数据为节点、页面转换关系为边的图。然而,这些技术难以捕捉现代Web应用程序固有的动态和交互行为。本文提出了一种新的方法,将每个节点建模为应用程序当前状态的结构化表示,边则反映用户发起的操作或状态转换。这种结构化表示能够更全面地理解Web应用程序的功能,为自动化测试和行为分析等下游任务提供有价值的见解。