Wikidata:一个巨大的交叉引用文件

2024-10-06

本文介绍了如何使用 DuckDB 和 Ruby 从 Wikidata 中提取地理实体数据,并构建交叉引用文件。Wikidata 是一个结构化的知识库,包含大量实体和关系数据,其中包括外部标识符,可以链接到其他数据库。作者详细描述了数据下载、预处理、提取和转换的过程,并最终生成了包含地理坐标、Wikidata ID 和外部标识符的交叉引用文件,为地理数据集成和分析提供了便利。

阅读更多

清醒的 AI 已成常态

2024-06-13

本文认为,尽管 OpenAI、谷歌等公司对 AI 大肆宣传,但实际上,大多数 AI 应用都非常“清醒”,开发者将 AI 视为数据管道中的一个组件,用于数据处理、分析和生成 SQL 语句等任务,而非创造超级智能。这种“清醒的 AI”虽然看似平淡无奇,但它能够真正帮助企业利用数据提高效率,实现数据驱动决策的愿景。

阅读更多
未分类

A POI Database in One Line | Drew Breunig

2024-04-19

该网站提供了一个使用一行代码创建位置兴趣点(POI)数据库的简单方法。它介绍了如何使用PostGIS扩展为PostgreSQL数据库创建POI表,包括ID、名称、位置和其他相关详细信息。文章还讨论了使用Python的GeoJSON文件将POI加载到数据库中的过程。

阅读更多
未分类