BloomSearch:基于分层布隆过滤器的海量数据集关键词搜索引擎

2025-07-16
BloomSearch:基于分层布隆过滤器的海量数据集关键词搜索引擎

BloomSearch是一个高性能的关键词搜索引擎,针对海量数据集设计。它巧妙地利用分层布隆过滤器,结合可插拔存储接口,实现了极低的内存占用和快速的冷启动搜索。支持字段搜索、词元搜索和字段:词元组合搜索,并允许使用AND/OR运算符组合查询条件。此外,BloomSearch还支持分区、最小最大索引和TTL功能,进一步提升了查询效率和数据管理能力。其可扩展的架构使其能够处理无限的摄取和查询吞吐量,非常适合处理日志、JSON文档和高基数关键词搜索等场景。