2026年第三週學習——記憶系統核心原理詳情 - 人工智能,ai-agent AIAgent研究博客 | YeLogs.com

博客 / 詳情

2026年第三週學習——記憶系統核心原理

08:13 AM · Jan 09 ,2026

核心目標

區分短期/長期/經驗記憶，理解向量數據庫的作用

推薦資源

1、AI Agent 記憶系統：技術原理、架構設計與實戰落地全解析

https://segmentfault.com/a/1190000047526306

2、Chroma 官方入門教程（完整中文版，適配新手學習）

https://segmentfault.com/a/1190000047526436

實戰任務

AI Agent 三層記憶系統對比表（存儲內容/生命週期/技術選型）

AI Agent 三層記憶系統的劃分遵循 “推理即時性→會話連貫性→跨會話持久性” 的核心邏輯，對應工作記憶、短期記憶、長期記憶三個層級，三者協同支撐 Agent 從“實時推理”到“長期個性化服務”的能力。以下是詳細對比：

對比維度	工作記憶（Working Memory）	短期記憶（Short-Term Memory, STM）	長期記憶（Long-Term Memory, LTM）
核心定位	Agent 推理時的“臨時草稿紙”，存儲中間推理狀態	會話內的“交互緩衝區”，維持單次會話的上下文連貫性	跨會話的“知識金庫”，沉澱可複用的用户偏好、事實知識、任務經驗
存儲內容	1. 任務拆分的中間步驟（如“查航班→訂酒店→發行程”的子任務狀態） 2. 工具調用的臨時結果（如 API 原始返回數據） 3. 推理鏈的上下文碎片（如“用户訂單號是 12345”的臨時變量）	1. 會話內的用户輸入/Agent 回覆（純文本/多模態數據） 2. 工具調用的結構化結果（如格式化後的物流信息） 3. 會話級的上下文元數據（如會話 ID、開始時間）	1. 用户長期偏好（如“喜歡無糖奶茶”“對海鮮過敏”） 2. 結構化事實知識（如知識圖譜三元組、實體關係） 3. 跨會話任務經驗（如“用户上週諮詢過巴黎旅行”） 4. 個性化配置（如用户習慣的回覆風格）
生命週期	推理過程內（秒級~分鐘級）任務推理結束/Agent 重啓後立即銷燬，不持久化	單次會話內（分鐘級~小時級）會話結束後可選擇清理或提煉為長期記憶，默認不持久化	跨會話持久化（天級~月級，可配置過期）主動寫入外部存儲，除非手動刪除/過期清理，否則永久保留
容量限制	極小（KB 級），僅存儲當前推理步驟的關鍵數據，避免佔用計算資源	中等（MB 級），受 LLM 上下文窗口限制（如 GPT-4 128K 窗口≈6 萬漢字）	極大（GB~TB 級），取決於外部存儲硬件，支持百萬級~億級記憶條目
技術選型-存儲載體	1. 內存數據結構（Python 列表/字典、隊列 `deque`） 2. 無持久化需求，無需數據庫支撐	1. 內存數據庫（Redis 單機/Cluster、Dragonfly）：支持高吞吐讀寫，TTL 自動過期 2. LLM 原生上下文窗口：直接作為短期記憶載體	1. 向量數據庫（Milvus、Chroma、Pinecone）：存儲非結構化文本的語義向量，支持相似性檢索 2. 關係數據庫（MySQL、PostgreSQL）：存儲結構化用户偏好、元數據 3. 圖數據庫（Neo4j、TigerGraph）：存儲實體關係、知識圖譜 4. 混合存儲（向量庫+關係庫）：兼顧語義檢索與精確查詢
技術選型-核心算法	1. 推理鏈狀態管理（如 LangChain 的 `AgentExecutor` 狀態追蹤） 2. 臨時數據緩存淘汰（LRU 策略）	1. 上下文窗口優化（滑動窗口、摘要壓縮、上下文卸載） 2. 會話隔離（Redis 按會話 ID 分庫/分 key）	1. 向量嵌入（Sentence-BERT、OpenAI Embedding）：文本轉高維向量 2. 相似性檢索（HNSW 索引、餘弦相似度計算） 3. 記憶鞏固（LLM 提煉短期記憶為結構化長期記憶） 4. 記憶遺忘（時間衰減、重要性評分淘汰）
訪問特性	讀寫速度極快（納秒~微秒級），與 Agent 推理邏輯強耦合，無需獨立接口	讀寫速度快（毫秒級），需支持高併發（如客服 Agent 同時處理上千會話），接口簡單（Set/Get）	讀慢寫快（讀：毫秒~秒級，需檢索計算；寫：毫秒級），需複雜索引優化，支持過濾、排序、多條件查詢
核心特點	1. 臨時性：隨推理而生，隨推理而滅 2. 關聯性：與當前任務強綁定，無複用價值 3. 輕量級：不佔用持久化資源	1. 連貫性：維持會話內的上下文一致性，避免用户重複提問 2. 時效性：僅覆蓋單次會話，過期自動清理 3. 低成本：內存存儲，無需複雜運維	1. 持久性：跨會話複用，支撐個性化服務 2. 可解釋性：結構化存儲，可追溯記憶來源 3. 可管理性：支持用户查看、編輯、刪除記憶（合規要求）
典型應用場景	1. 複雜任務規劃（如“寫一篇論文”的大綱拆分、文獻檢索步驟） 2. 多工具協同調用（如先查天氣再推薦出行方案）	1. 多輪對話交互（如“幫我修改報告第三段”→“再縮短 50 字”） 2. 實時客服諮詢（如訂單查詢、物流跟蹤）	1. 個性化推薦（如“用户喜歡科幻電影，推薦新片”） 2. 長期陪伴 Agent（如情感助手記住用户生日） 3. 企業級知識管理（如 Agent 記住公司產品參數）

補充説明：三層記憶的協同流程

以 “旅行助手 Agent 推薦巴黎景點” 為例，三層記憶的協作邏輯如下：

工作記憶：Agent 接收到“推薦巴黎景點”的查詢後，臨時存儲推理步驟 → [1. 檢索用户偏好 → 2. 匹配景點 → 3. 生成推薦語]，並緩存工具調用的原始景點數據；
短期記憶：從 Redis 中讀取本次會話的歷史交互 → [用户：我喜歡印象派藝術]，注入 LLM 上下文；
長期記憶：從 Chroma 向量庫中檢索用户跨會話偏好 → [用户計劃 2025 年 7 月去巴黎旅行]，與短期記憶融合；
推理完成後：工作記憶銷燬；短期記憶保留至會話結束；若用户新增偏好（如“不要太貴的景點”），則提煉為長期記憶寫入向量庫。

選型建議

Agent 場景	推薦記憶層級組合	技術棧示例
一次性腳本/輕量工具 Agent	僅工作記憶 + 極簡短期記憶（滑動窗口）	Python `deque` + LLM 上下文窗口
客服/實時對話 Agent	工作記憶 + 短期記憶（Redis）	Redis + GPT-4 128K 上下文
個性化陪伴/企業級 Agent	工作記憶 + 短期記憶 + 長期記憶（混合存儲）	Python 內存 + Redis + Chroma + MySQL

註冊Chroma雲服務，完成基礎環境搭建

人工智能 , ai-agent

0 位用戶收藏了這個故事！