PyPI依赖关系可视化:发现隐藏的软件包集群
2025-03-04
作者通过可视化PyPI中超过50万个开源Python软件包的依赖关系,构建了一个巨大的图网络。通过数据清洗和Gephi软件,作者成功展现了软件包间的依赖关系,并从中发现了有趣的现象:一些软件包形成了紧密的集群,例如围绕NumPy的科学计算包集群;也有一些异常集群,包含一些可疑的软件包,这暗示了可视化方法在检测恶意软件包方面的潜力。此外,一些大型企业如Triton和Odoo的软件包也因其内部依赖关系而聚集在一起。这项研究为探索PyPI生态系统提供了新的视角,也展现了数据可视化在软件包分析中的强大作用。
开发