QB64 搜索技巧 核手提箱 文字记录 海洋云增白 开源地图 Bliss AI 搜索答案 深海沉船 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 世界 PostgreSQL AI工具 证券 DirectX 防溢 DrawingPics Zulip 儿童读物 化学 连续滚动 代码审查 三菱电机 更多

一种用于计数不同元素的迷人算法 (justinjaffray.com)

本文介绍了一种名为“Distinct Elements in Streams: An Algorithm for the (Text) Book”的论文中提出的计数不同元素的算法。该算法通过动态调整概率p来控制集合的大小,从而实现对不同元素数量的估计。文章首先介绍了传统的基于哈希表的精确计数方法,然后逐步推导出这种基于概率的近似算法。算法的核心思想是,当集合大小达到阈值时,将概率p减半,并对集合中的元素进行筛选,以确保每个元素都有p的概率被保留。最终,集合大小除以p即为不同元素数量的估计值。