在日常的數據分析和業務報表中,TopN 查詢幾乎無處不在:無論是尋找銷量最高的前十件商品,還是篩選訪問量最多的前幾條日誌,開發者和數據分析師都在頻繁處理“前 N 條數據”。然而,當表的列數達到百餘或更多時,一個看似簡單的 SELECT \* … ORDER BY … LIMIT N 查詢,背後可能隱藏着巨大的性能瓶頸。儘管我們只關心某一列的前 N 條結果,數據庫依然可能掃描整張表的所有列,從而導致
AI 時代正在重塑數據庫的角色。過去,數據庫主要為人類分析者提供報表與查詢能力;而現在,越來越多的查詢來自智能代理(Agent),它們會自動檢索知識、過濾數據、組合多種信號,並將數據庫作為“實時信息源”支撐推理與決策。
這一根本性變化,對數據庫的檢索能力提出了全新挑戰。傳統單一的搜索模式(無論是關鍵詞還是向量搜索)已顯不足,在應對複雜多模態的 Agent 查詢時,往往在缺乏結果的全面性、語義的精確
數據價值的不斷升級,是過去三十年來數據庫演進的核心驅動力。而 AI 的崛起,將這一需求推向新的高度:數據不僅要能被“看”到,更要能被“理解”和“創造”——這一點已在基於大語言模型(LLM)為核心的代碼生成、智能對話等應用中得以驗證。
這一背景下,由自主 AI 智能體(Agent)驅動的分析已成為典型範式。 智能體能夠獨立推理、實時分析數據,甚至主動觸發行動。這意味着分析模式正從被動報告轉向主動決策