GitHub Organisations-Scraping-Skripte

2025-05-25
GitHub Organisations-Scraping-Skripte

Diese Skriptsammlung scrapet GitHub nach Informationen zu Organisationen und erzeugt eine TSV-Datei mit dem Organisationsnamen, der URL, dem Standort und der Anzahl der Sterne ausgewählter Repositorys. `get_all_orgs.sh` ruft eine Liste aller GitHub-Organisationen ab; `get_orgs_tsv.py` scrapet die Daten jeder Organisation und gibt eine TSV-Datei aus; `sorry.sh` behandelt die Rate-Limiting-Richtlinie von GitHub, wobei der Benutzer seine IP-Adresse manuell zurücksetzen muss.

Entwicklung Scraping