수천 년에 걸친 글로벌 도시 인구 데이터 세트의 공간적 활용
2025-06-18

본 논문은 찬들러와 모델스키의 연구 결과를 통합한 기원전 3700년부터 서기 2000년까지의 방대한 글로벌 도시 인구 데이터 세트 생성 과정을 자세히 설명합니다. 인쇄물과 다양한 디지털 형식으로 존재하는 원 데이터는 디지털화 및 공간화(지오코딩)에 있어 상당한 어려움을 야기했습니다. 폰트 및 페이지 품질 문제로 인해 OCR 시도는 실패했고, 수동 전사가 필요했습니다. 지오코딩에는 CartoDB, GeoNames, Ancient Locations 데이터베이스, Getty Thesaurus가 사용되었으며, 정확도 향상을 위해서는 수동 검증이 필수적이었습니다. 최종 데이터 세트에는 1599개의 도시 위치가 포함되어 광범위한 글로벌 및 시간적 범위를 제공하지만, 데이터 부족, 모호한 도시 정의, 고대 도시 위치의 불확실성 등 몇 가지 한계가 남아 있습니다. 그럼에도 불구하고 디지털화되고 공간적으로 활용 가능한 데이터 세트는 역사가, 지리학자, 생태학자 등 연구자들에게 글로벌 도시화 경향을 분석하기 위한 쉽게 접근 가능한 데이터를 제공합니다.