Habilitando espacialmente um conjunto de dados de população de cidades globais milenares

Este artigo detalha a criação de um extenso conjunto de dados de população de cidades globais integrando o trabalho de Chandler e Modelski, abrangendo de 3700 a.C. a 2000 d.C. Os dados originais, em livros impressos e formatos digitais diversos, apresentaram desafios significativos de digitalização e espacialização (geocodificação). Tentativas de OCR falharam devido a problemas de fonte e qualidade de página, exigindo transcrição manual. A geocodificação utilizou CartoDB, GeoNames, o banco de dados Ancient Locations e o Getty Thesaurus, com a verificação manual crucial para a precisão. O conjunto de dados final contém 1599 locais de cidades, oferecendo ampla cobertura global e temporal, mas ainda existem limitações: esparsidade de dados, definições ambíguas de cidades e incertezas em locais de cidades antigas. Apesar disso, o conjunto de dados digitalizado e espacializado oferece dados facilmente acessíveis para pesquisadores (historiadores, geógrafos, ecologistas, etc.) analisarem as tendências de urbanização global.