Scripts de Scraping d'Organisations GitHub
2025-05-25
Cet ensemble de scripts récupère les informations des organisations sur GitHub, produisant un fichier TSV contenant le nom de l'organisation, l'URL, l'emplacement et le nombre d'étoiles de certains dépôts. `get_all_orgs.sh` récupère la liste de toutes les organisations GitHub ; `get_orgs_tsv.py` récupère les données de chaque organisation et génère un fichier TSV ; `sorry.sh` gère la politique de limitation de débit de GitHub, nécessitant une réinitialisation manuelle de l'adresse IP de l'utilisateur.
Développement