@檢索系統

动态 列表
@elhix0bg

為什麼 OpenSearch 向量檢索能提速 13 倍

在當今的數字化時代,以音視頻等多媒體內容為代表的非結構化數據呈現出爆炸式增長。這類數據無法簡單地用傳統數據庫中的行列數據來表示,因此向量檢索技術應運而生。非結構化數據通常被轉換為向量表示,並存儲在向量數據庫中。這種向量化模型能夠提取並捕捉到數據中的特徵,在多維的向量空間中進行有效表示。 一個形象的例子是:embedding(king)−embedding(man)+embedding(wom

elhix0bg 头像

@elhix0bg

昵称 阿里雲大數據AI

@momodel

ColBERT——以詞元級別的向量嵌入提升信息檢索效果

介紹 檢索增強一代 (RAG) 自成立以來就風靡全球。RAG 是大型語言模型 (LLM) 提供或生成準確和事實答案所必需的。我們通過RAG解決LLM的事實性,我們嘗試為LLM提供一個與用户查詢上下文相似的上下文,以便LLM將處理此上下文並生成事實正確的響應。我們通過以向量嵌入的形式表示我們的數據和用户查詢並執行餘弦相似性來做到這一點。但問題是,所有傳統方法都以單個嵌入表示數據,這對於良好的檢索系統

momodel 头像

@momodel

昵称 Momodel

@elhix0bg

雲棲實錄 | AI 搜索智能探索:揭秘如何讓搜索“有大腦”

演講主題:AI搜索智能探索——基於AI搜索開放平台的AgenticSearch算法技術揭秘 在全球AI技術快速迭代的背景下,信息檢索與搜索技術正迎來革命性突破。 9月26日,雲棲大會AI搜索與向量引擎分論壇上,阿里雲智能集團高級技術專家——徐光偉深度解析了基於AI搜索開放平台的AgenticSearch算法技術體系,並結合技術架構演進與商業化實踐,展示了阿里雲在向量模型優化、多模態檢索、DeepS

elhix0bg 头像

@elhix0bg

昵称 阿里雲大數據AI

@elhix0bg

從“字”到“畫”:基於Elasticsearch Serverless 的多模態商品搜索實踐

隨着人工智能技術的飛速發展,用户對於搜索體驗的要求早已超越了傳統的關鍵詞匹配。我們正處在一個從文本搜索向多模態、跨模態搜索演進的時代。用户希望能夠通過圖片、甚至是自然語言描述的複雜場景,來精準地找到他們想要的商品。然而,如何理解並檢索圖片中的視覺元素?如何處理那些文本標題無法完全概括的商品特徵?這些都是傳統搜索面臨的挑戰。 本文將深入探討多模態商品檢索的通用解決方案,詳細解讀其背後的兩大核心技術:

elhix0bg 头像

@elhix0bg

昵称 阿里雲大數據AI

@deephub

HNSW算法實戰:用分層圖索引替換k-NN暴力搜索

向量檢索是整個RAG管道的一個重要的步驟,傳統的暴力最近鄰搜索因為計算成本太高,擴展性差等無法應對大規模的搜索。 HNSW(Hierarchical Navigable Small World,分層可導航小世界圖)提供了一種對數時間複雜度的近似搜索方案。查詢時間卻縮短到原來的1/10,我們今天就來介紹HNSW算法。 傳統搜索方法在高緯度下會崩潰,並且最近鄰搜索(NNS)的線性時間複雜度讓成本變得不

deephub 头像

@deephub

昵称 deephub