BM𝒳:基于 BM25 的全新词法搜索算法

2024-08-18

BM𝒳是一种新的词法搜索算法,它在 BM25 的基础上进行了改进,并通过 Mixedbread 的开源 Baguetter 库易于使用。BM𝒳 结合了相似性和语义,引入了熵加权相似性和加权查询增强 (WQA) 等关键创新。在 BEIR、BRIGHT 和多语言基准测试中,BM𝒳 的表现均优于 BM25,显著提高了检索质量。

未分类 BM25