在生成式 AI 已經深入業務的今天,搜索系統的角色正在發生很明顯的變化。用户對搜索的期望不再侷限於關鍵詞匹配,而是希望系統具備語義理解、多模態處理以及實時推理能力。傳統的全文檢索依舊是基礎,但很難覆蓋這些新需求,搜索逐漸成為 AI 應用的核心底座。
Elastic 中國首席佈道師劉曉國在 GOTC 2025 全球開源技術峯會的演講提到了一個更實際的問題:在現有技術棧中,如何用向量搜索、混合搜索、RAG 和 Agentic 技術,構建面向未來的搜索體驗。
隨着用户行為不斷變化,搜索系統面對的挑戰和過去已經不一樣。詞法檢索繼續發揮作用,但複雜的查詢方式需要新的方法。語義搜索、跨模態檢索、模型重排序以及 RAG 結構正在成為主流。核心難題集中在兩點:系統是否理解用户的真實意圖,以及模型是否能訪問企業內部的實時數據。向量搜索和混合搜索為這兩個問題提供了關鍵能力。
混合搜索通過結合 BM25、向量相似度和 RRF 這樣的排序方法,讓語義召回和關鍵詞匹配形成互補,使得結果更穩定。本次分享也對構建搜索系統的流程進行了完整拆解:先加載 embedding 模型,再在數據寫入時生成向量,查詢時同時使用 match 和 kNN,並且支持過濾條件。從 8.7+ 開始,query_vector_builder 可以在查詢時自動生成向量,讓整個流程更加直接。
在底層能力上,向量引擎的更新同樣是重點內容。硬件加速覆蓋 CPU 指令集和 GPU/CAGRA,向量壓縮帶來 int8 和 int4 的成本優勢,新向量存儲格式如 DiskBBQ 提升了存儲與檢索的效率,並且在高併發下通過線程協同來降低延遲、提升吞吐。這些能力讓百萬級到十億級規模的向量檢索能夠在實際業務中穩定落地。
搜索趨勢也在向“重排序優先”的方向演進。分享中展示了從 BM25、ANN、稀疏召回,到 Query Rescorer、LTR,再到 Cohere Rerank、Elastic Reranker 等模型重排的完整路徑。系統先快速縮小候選集,再通過更強的模型提升精度,從而在成本和效果之間取得平衡。
RAG 在企業中的落地速度很快,因為大模型本身的知識是凍結的,無法反映企業實時數據,所以必須依賴檢索系統來補充外部信息。在這個模式下,混合搜索天然佔有優勢。分享中也展示了分塊策略對召回的影響,並説明了 Elasticsearch 在自動分塊和語義字段類型方面提供的簡化能力。進一步的發展方向是 Agentic RAG。它讓系統從回答問題擴展到執行任務,包括規劃、判斷和自主選擇工具。分享中展示的示例包括使用 MCP server、在 Kibana 中構建 Agents,以及與 Gemini Enterprise 的 A2A 協議集成,這讓搜索能力不再停留在數據入口,而是延伸到完整的 AI 決策鏈路。
回到整體趨勢,搜索的形態正在發生結構性變化。詞法搜索繼續提供穩定基座,向量搜索補充語義能力,混合搜索讓兩者協同,而重排序與 Agentic 工作流進一步提升系統的智能化水平。對於開發者和技術管理者來説,這套能力組合提供了非常明確的技術路徑,讓搜索從信息查找拓展到智能行為觸發,並能夠為未來的 AI 應用奠定基礎。
完整內容查看:https://www.oschina.net/doc/485