超越RAG:LLM工具调用开启语义搜索新篇章

2025-05-22
超越RAG:LLM工具调用开启语义搜索新篇章

本文探讨了语义搜索的实现方法,特别是利用LLM进行向量嵌入搜索。虽然直接嵌入用户搜索词和文档有时效果不佳,但一些新技术,例如Nomic Embed Text v2,可以改进嵌入方式,使问题和答案在向量空间中更接近。更进一步,可以使用LLM合成潜在答案,再进行嵌入搜索,找到相关的文档。文章还介绍了基于LLM的检索增强生成(RAG)系统,强调了RAG并不依赖于向量嵌入,可以结合关键词搜索或构建混合搜索系统。作者认为,尽管长上下文模型的出现,RAG并不会消亡,因为数据量总是超过模型上下文容量。作者更推崇LLM工具调用方法,例如o3和o4-mini,认为这种方法比传统的RAG(单次检索后直接回答)更有效。

AI