xkcd漫画揭秘:十一号的失踪之谜

2025-06-19

一个xkcd漫画引发了对谷歌Ngrams数据库中月份“十一号”出现频率低得异常的疑问。作者通过数据分析证实了这一现象,并最终发现罪魁祸首是印刷技术和OCR识别错误:数字“1”与字母“I”、“l”、“i”相似,导致“11th”被误读为“IIth”、“Ilth”等,甚至被误读为“nth”。尤其在打字机时代,这种错误更为普遍,因为早期打字机没有独立的“1”键。这一发现揭示了看似简单的数字识别背后隐藏的复杂性,以及技术发展对数据分析的影响。

杂项