PyPI 의존성 그래프 시각화: 숨겨진 패키지 클러스터 발견

2025-03-04

PyPI에 있는 50만 개가 넘는 오픈소스 Python 패키지의 의존성 그래프를 시각화하여 저자는 거대한 네트워크 그래프를 구축했습니다. 데이터 정리 및 Gephi 소프트웨어를 사용하여 패키지 간의 의존성 관계를 밝히고 흥미로운 현상을 발견했습니다. NumPy를 중심으로 한 과학 계산 패키지 클러스터와 같이 일부 패키지는 밀집된 클러스터를 형성하는 반면, 의심스러운 패키지를 포함하는 이상 클러스터도 발견되어 시각화 기법을 통한 악성 패키지 탐지 가능성을 시사합니다. 또한, Triton과 Odoo와 같은 대기업의 패키지도 내부 의존성 때문에 함께 표시됩니다. 이 연구는 PyPI 생태계를 탐구하는 새로운 관점을 제공하고 데이터 시각화의 패키지 분석에서의 위력을 보여줍니다.

개발