Scripts de Raspado de Organizaciones de GitHub
2025-05-25
Este conjunto de scripts raspa GitHub para obtener información de organizaciones, produciendo finalmente un archivo TSV que contiene el nombre de la organización, la URL, la ubicación y el recuento de estrellas de repositorios seleccionados. `get_all_orgs.sh` recupera una lista de todas las organizaciones de GitHub; `get_orgs_tsv.py` extrae datos de cada organización y genera un TSV; `sorry.sh` maneja la política de limitación de velocidad de GitHub, requiriendo que los usuarios restablezcan manualmente su dirección IP.
Desarrollo
raspado