Webtagr - Technology News Summarizer

Popular：

Virtualization DNS security formal verification reachability analysis compiler errors macro conflict web extension development framework Bitmap Graphics API inconsistencies All Tags

Newswire：一个涵盖百年历史新闻的大规模结构化数据库

2024-06-30

本文介绍了一个名为Newswire的大规模结构化数据库，该数据库包含了从1878年到1977年间美国270万篇新闻专线文章，文章内容主要来自当地报纸。该数据库通过深度学习管道从大量原始报纸图像扫描中重建，并对文章进行了地理参考、主题标记、命名实体识别和人物消歧等处理，为研究计算语言学、社会科学和数字人文等领域的各种问题提供了宝贵资源。

(arxiv.org)

未分类历史新闻