本文介绍了 CedarDB 数据库中用于连接处理的哈希表实现。该实现针对数据库系统的独特需求进行了优化,例如并行数据处理、高效过滤不匹配行以及对重复数据倾斜的鲁棒性。文章详细解释了如何利用并行构建、Bloom 过滤器和无链布局等技术来实现这些目标。最后,通过与其他哈希表实现的比较,展示了该方法在图形和关系工作负载上的性能优势。