PyPI依存関係グラフの可視化:隠れたパッケージクラスタの発見

2025-03-04

PyPIにある50万を超えるオープンソースPythonパッケージの依存関係グラフを可視化することで、著者は巨大なネットワークグラフを構築しました。データクレンジングとGephiソフトウェアを用いて、パッケージ間の依存関係を明らかにし、興味深い現象を発見しました。NumPyを中心とした科学計算パッケージクラスタなど、いくつかのパッケージが密なクラスタを形成する一方、疑わしいパッケージを含む異常なクラスタも見つかり、可視化手法による悪意のあるパッケージ検出の可能性を示唆しています。さらに、TritonやOdooなどの大企業のパッケージも、内部依存関係のためにまとまって表示されます。この研究は、PyPIエコシステムを探求するための新たな視点を提供し、データ可視化のパッケージ分析における威力を示しています。

開発