Este artículo detalla la creación de un extenso conjunto de datos de población de ciudades globales que integra el trabajo de Chandler y Modelski, abarcando desde el 3700 a. C. hasta el 2000 d. C. Los datos originales, en libros impresos y formatos digitales diversos, presentaron importantes desafíos de digitalización y espacialización (geocodificación). Los intentos de OCR fallaron debido a problemas de fuente y calidad de página, lo que requirió la transcripción manual. La geocodificación utilizó CartoDB, GeoNames, la base de datos Ancient Locations y el Getty Thesaurus, con la verificación manual crucial para la precisión. El conjunto de datos final contiene 1599 ubicaciones de ciudades, ofreciendo una amplia cobertura global y temporal, pero aún existen limitaciones: escasez de datos, definiciones ambiguas de ciudades e incertidumbres en las ubicaciones de ciudades antiguas. A pesar de ello, el conjunto de datos digitalizado y espacializado ofrece datos fácilmente accesibles para investigadores (historiadores, geógrafos, ecólogos, etc.) para analizar las tendencias de urbanización global.