Visualisierung des PyPI-Abhängigkeitsgraphen: Aufdeckung versteckter Paketcluster

2025-03-04

Durch die Visualisierung des Abhängigkeitsgraphen von über einer halben Million Open-Source-Python-Paketen auf PyPI erstellt der Autor einen massiven Netzwerkgraphen. Nach der Datenbereinigung und der Verwendung der Software Gephi zeigt der Autor erfolgreich die Abhängigkeitsbeziehungen zwischen den Paketen auf und entdeckt interessante Phänomene: Einige Pakete bilden enge Cluster, wie beispielsweise den Cluster von wissenschaftlichen Rechenpaketen um NumPy herum; andere sind anomale Cluster, die verdächtige Pakete enthalten, was auf das Potenzial von Visualisierungsmethoden zur Erkennung bösartiger Pakete hindeutet. Darüber hinaus gruppieren sich auch Pakete großer Unternehmen wie Triton und Odoo aufgrund ihrer internen Abhängigkeiten. Diese Forschung bietet eine neue Perspektive auf die Erforschung des PyPI-Ökosystems und zeigt die Leistungsfähigkeit der Datenvisualisierung bei der Paketanalyse.

Entwicklung