BloomSearch: mecanismo de busca de palavras-chave para conjuntos de dados massivos usando filtros Bloom hierárquicos

2025-07-16
BloomSearch: mecanismo de busca de palavras-chave para conjuntos de dados massivos usando filtros Bloom hierárquicos

O BloomSearch é um mecanismo de busca de palavras-chave de alto desempenho projetado para conjuntos de dados massivos. Usando filtros Bloom hierárquicos e interfaces de armazenamento plugáveis, ele atinge um uso de memória extremamente baixo e buscas de inicialização a frio rápidas. Ele suporta buscas por campo, buscas por token e combinações de campo:token com operadores AND/OR. O BloomSearch também possui particionamento, índices min-max e TTL para desempenho de consulta aprimorado e gerenciamento de dados. Sua arquitetura escalonável lida com ingestão e taxa de transferência de consultas ilimitadas, tornando-o ideal para logs, documentos JSON e busca de palavras-chave de alta cardinalidade.