Visualisation du graphe de dépendances de PyPI : découverte de clusters de paquets cachés

2025-03-04

En visualisant le graphe de dépendances de plus d’un demi-million de paquets Python open source sur PyPI, l’auteur construit un graphe réseau massif. Après le nettoyage des données et l’utilisation du logiciel Gephi, l’auteur révèle avec succès les relations de dépendance entre les paquets et découvre des phénomènes intéressants : certains paquets forment des clusters serrés, comme le cluster de paquets de calcul scientifique autour de NumPy ; d’autres sont des clusters anormaux contenant des paquets suspects, ce qui suggère le potentiel des méthodes de visualisation pour détecter les paquets malveillants. De plus, les paquets de grandes entreprises comme Triton et Odoo se regroupent également en raison de leurs dépendances internes. Cette recherche offre une nouvelle perspective pour explorer l’écosystème PyPI et démontre la puissance de la visualisation de données dans l’analyse des paquets.

Développement