Scripts de Scraping d'Organisations GitHub

2025-05-25
Scripts de Scraping d'Organisations GitHub

Cet ensemble de scripts récupère les informations des organisations sur GitHub, produisant un fichier TSV contenant le nom de l'organisation, l'URL, l'emplacement et le nombre d'étoiles de certains dépôts. `get_all_orgs.sh` récupère la liste de toutes les organisations GitHub ; `get_orgs_tsv.py` récupère les données de chaque organisation et génère un fichier TSV ; `sorry.sh` gère la politique de limitation de débit de GitHub, nécessitant une réinitialisation manuelle de l'adresse IP de l'utilisateur.

Développement