博客 / 詳情

返回

2026年第三週學習——記憶系統核心原理

核心目標

區分短期/長期/經驗記憶,理解向量數據庫的作用

推薦資源

1、AI Agent 記憶系統:技術原理、架構設計與實戰落地全解析

https://segmentfault.com/a/1190000047526306

2、Chroma 官方入門教程(完整中文版,適配新手學習)

https://segmentfault.com/a/1190000047526436

實戰任務

AI Agent 三層記憶系統對比表(存儲內容/生命週期/技術選型)

AI Agent 三層記憶系統的劃分遵循 “推理即時性→會話連貫性→跨會話持久性” 的核心邏輯,對應工作記憶、短期記憶、長期記憶三個層級,三者協同支撐 Agent 從“實時推理”到“長期個性化服務”的能力。以下是詳細對比:

對比維度 工作記憶(Working Memory) 短期記憶(Short-Term Memory, STM) 長期記憶(Long-Term Memory, LTM)
核心定位 Agent 推理時的“臨時草稿紙”,存儲中間推理狀態 會話內的“交互緩衝區”,維持單次會話的上下文連貫性 跨會話的“知識金庫”,沉澱可複用的用户偏好、事實知識、任務經驗
存儲內容 1. 任務拆分的中間步驟(如“查航班→訂酒店→發行程”的子任務狀態)
2. 工具調用的臨時結果(如 API 原始返回數據)
3. 推理鏈的上下文碎片(如“用户訂單號是 12345”的臨時變量)
1. 會話內的用户輸入/Agent 回覆(純文本/多模態數據)
2. 工具調用的結構化結果(如格式化後的物流信息)
3. 會話級的上下文元數據(如會話 ID、開始時間)
1. 用户長期偏好(如“喜歡無糖奶茶”“對海鮮過敏”)
2. 結構化事實知識(如知識圖譜三元組、實體關係)
3. 跨會話任務經驗(如“用户上週諮詢過巴黎旅行”)
4. 個性化配置(如用户習慣的回覆風格)
生命週期 推理過程內(秒級~分鐘級)
任務推理結束/Agent 重啓後立即銷燬,不持久化
單次會話內(分鐘級~小時級)
會話結束後可選擇清理或提煉為長期記憶,默認不持久化
跨會話持久化(天級~月級,可配置過期)
主動寫入外部存儲,除非手動刪除/過期清理,否則永久保留
容量限制 極小(KB 級),僅存儲當前推理步驟的關鍵數據,避免佔用計算資源 中等(MB 級),受 LLM 上下文窗口限制(如 GPT-4 128K 窗口≈6 萬漢字) 極大(GB~TB 級),取決於外部存儲硬件,支持百萬級~億級記憶條目
技術選型-存儲載體 1. 內存數據結構(Python 列表/字典、隊列 deque
2. 無持久化需求,無需數據庫支撐
1. 內存數據庫(Redis 單機/Cluster、Dragonfly):支持高吞吐讀寫,TTL 自動過期
2. LLM 原生上下文窗口:直接作為短期記憶載體
1. 向量數據庫(Milvus、Chroma、Pinecone):存儲非結構化文本的語義向量,支持相似性檢索
2. 關係數據庫(MySQL、PostgreSQL):存儲結構化用户偏好、元數據
3. 圖數據庫(Neo4j、TigerGraph):存儲實體關係、知識圖譜
4. 混合存儲(向量庫+關係庫):兼顧語義檢索與精確查詢
技術選型-核心算法 1. 推理鏈狀態管理(如 LangChain 的 AgentExecutor 狀態追蹤)
2. 臨時數據緩存淘汰(LRU 策略)
1. 上下文窗口優化(滑動窗口、摘要壓縮、上下文卸載)
2. 會話隔離(Redis 按會話 ID 分庫/分 key)
1. 向量嵌入(Sentence-BERT、OpenAI Embedding):文本轉高維向量
2. 相似性檢索(HNSW 索引、餘弦相似度計算)
3. 記憶鞏固(LLM 提煉短期記憶為結構化長期記憶)
4. 記憶遺忘(時間衰減、重要性評分淘汰)
訪問特性 讀寫速度極快(納秒~微秒級),與 Agent 推理邏輯強耦合,無需獨立接口 讀寫速度快(毫秒級),需支持高併發(如客服 Agent 同時處理上千會話),接口簡單(Set/Get) 讀慢寫快(讀:毫秒~秒級,需檢索計算;寫:毫秒級),需複雜索引優化,支持過濾、排序、多條件查詢
核心特點 1. 臨時性:隨推理而生,隨推理而滅
2. 關聯性:與當前任務強綁定,無複用價值
3. 輕量級:不佔用持久化資源
1. 連貫性:維持會話內的上下文一致性,避免用户重複提問
2. 時效性:僅覆蓋單次會話,過期自動清理
3. 低成本:內存存儲,無需複雜運維
1. 持久性:跨會話複用,支撐個性化服務
2. 可解釋性:結構化存儲,可追溯記憶來源
3. 可管理性:支持用户查看、編輯、刪除記憶(合規要求)
典型應用場景 1. 複雜任務規劃(如“寫一篇論文”的大綱拆分、文獻檢索步驟)
2. 多工具協同調用(如先查天氣再推薦出行方案)
1. 多輪對話交互(如“幫我修改報告第三段”→“再縮短 50 字”)
2. 實時客服諮詢(如訂單查詢、物流跟蹤)
1. 個性化推薦(如“用户喜歡科幻電影,推薦新片”)
2. 長期陪伴 Agent(如情感助手記住用户生日)
3. 企業級知識管理(如 Agent 記住公司產品參數)

補充説明:三層記憶的協同流程

“旅行助手 Agent 推薦巴黎景點” 為例,三層記憶的協作邏輯如下:

  1. 工作記憶:Agent 接收到“推薦巴黎景點”的查詢後,臨時存儲推理步驟 → [1. 檢索用户偏好 → 2. 匹配景點 → 3. 生成推薦語],並緩存工具調用的原始景點數據;
  2. 短期記憶:從 Redis 中讀取本次會話的歷史交互 → [用户:我喜歡印象派藝術],注入 LLM 上下文;
  3. 長期記憶:從 Chroma 向量庫中檢索用户跨會話偏好 → [用户計劃 2025 年 7 月去巴黎旅行],與短期記憶融合;
  4. 推理完成後:工作記憶銷燬;短期記憶保留至會話結束;若用户新增偏好(如“不要太貴的景點”),則提煉為長期記憶寫入向量庫。

選型建議

Agent 場景 推薦記憶層級組合 技術棧示例
一次性腳本/輕量工具 Agent 僅工作記憶 + 極簡短期記憶(滑動窗口) Python deque + LLM 上下文窗口
客服/實時對話 Agent 工作記憶 + 短期記憶(Redis) Redis + GPT-4 128K 上下文
個性化陪伴/企業級 Agent 工作記憶 + 短期記憶 + 長期記憶(混合存儲) Python 內存 + Redis + Chroma + MySQL

註冊Chroma雲服務,完成基礎環境搭建

user avatar
0 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.