Habilitando espacialmente un conjunto de datos de población de ciudades globales milenarias
Este artículo detalla la creación de un extenso conjunto de datos de población de ciudades globales que integra el trabajo de Chandler y Modelski, abarcando desde el 3700 a. C. hasta el 2000 d. C. Los datos originales, en libros impresos y formatos digitales diversos, presentaron importantes desafíos de digitalización y espacialización (geocodificación). Los intentos de OCR fallaron debido a problemas de fuente y calidad de página, lo que requirió la transcripción manual. La geocodificación utilizó CartoDB, GeoNames, la base de datos Ancient Locations y el Getty Thesaurus, con la verificación manual crucial para la precisión. El conjunto de datos final contiene 1599 ubicaciones de ciudades, ofreciendo una amplia cobertura global y temporal, pero aún existen limitaciones: escasez de datos, definiciones ambiguas de ciudades e incertidumbres en las ubicaciones de ciudades antiguas. A pesar de ello, el conjunto de datos digitalizado y espacializado ofrece datos fácilmente accesibles para investigadores (historiadores, geógrafos, ecólogos, etc.) para analizar las tendencias de urbanización global.