数千年におよぶグローバル都市人口データセットの空間的有効化
2025-06-18
本論文は、チャンドラーとモデルスキの研究成果を統合した、紀元前3700年から西暦2000年までの大規模なグローバル都市人口データセットの作成について詳述しています。印刷物と様々なデジタル形式で存在する元データは、デジタル化と空間化(ジオコーディング)において大きな課題をもたらしました。フォントとページの品質の問題により、OCRの試みは失敗し、手動による転写が必要となりました。ジオコーディングには、CartoDB、GeoNames、Ancient Locationsデータベース、Getty Thesaurusが利用され、精度の向上には手動による検証が不可欠でした。最終的なデータセットは1599の都市の場所を含み、広範なグローバルおよび時間的カバレッジを提供しますが、データの希薄さ、都市の曖昧な定義、古代都市の場所の不確実性など、いくつかの限界が残っています。それにもかかわらず、デジタル化され空間的に有効化されたデータセットは、歴史家、地理学者、生態学者などの研究者にとって、グローバルな都市化傾向を分析するための容易にアクセス可能なデータを提供します。