这篇文章是对Hans Peter Luhn于1953年发表的“一种新的信息记录和搜索方法”论文的注释/解释版本。 Luhn的方法使用标识词或“标准”集来描述文档,从而预见了诸如关键字搜索和相关性排名之类的现代搜索概念。 Luhn认识到,使用非常具体的术语来描述主题可能会导致记录信息与搜索信息之间不匹配,因为不同的人可能会对同一概念使用不同的特定术语。 为此,他提出了一种反直觉的方法:使用更广泛,更笼统的术语,并使用更多术语,即使到了冗余的地步。