過去兩年,AI智能體(AI Agent)成為AI落地的熱門方向。從 ChatGPT 的對話助手,到自動化辦公、代碼助手,再到多智能體協作平台,智能體被視為未來人機交互的核心形態。
然而在實際落地中,很多企業會發現一個殘酷現實:
構建一個真正可用的智能體,90% 的工作是軟件工程,只有 10% 才是 AI。
這一觀點最早由 Rakesh Gohel 在其著名的AI Agent冰山模型中提出,並在業內引發了廣泛共鳴。本文將深入解析這背後的邏輯。
圖來源:Rakesh Gohel(linkedin)
一、為什麼智能體是 90% 軟件工程、10% AI?
表面上,智能體看起來只是一個能理解自然語言、會自動生成結果的“大模型應用”。但真正的企業級智能體落地,遠不止一個 LLM:
- AI 模型只解決“腦子”的問題
- 理解任務、規劃步驟、生成內容或結果
- 這一部分就是“10% AI”
- 軟件工程支撐智能體的整個“身體和神經系統”
-
用户交互、權限控制、任務編排、數據流轉、工具調用、日誌監控、異常回滾
-
這些工作是“90% 軟件工程”,沒有它們,智能體無法穩定運行
用一句話概括:
AI 決定智能體“懂不懂”,軟件工程決定它“能不能幹活”。
二、AI智能體的冰山模型
為了直觀説明這 90/10 的關係,我們可以用冰山模型來理解智能體架構:
1. 水面上的 10%:用户可見的 AI
- 內容:自然語言交互、意圖理解、文本/代碼/報表生成
- 典型體驗:
- C端:ChatGPT、文心一言、通義千問、Cursor
- B端:智能工單助手、報銷自動審核、代碼自動補全
- 核心能力:
-
大模型(LLM)語義理解與生成
-
基礎任務規劃與工具選擇
用户看到的“智能”部分,其實只是冰山一角。
2. 水面下的 90%:支撐智能體運行的軟件工程
這部分是企業真正的建設難點,主要包括:
- 前端與交互層
- Web端、移動端、企業IM(釘釘/飛書)入口
- 對話UI、任務面板、狀態可視化
- 記憶與上下文管理
-
長短期對話記憶、任務鏈狀態、文檔緩存
-
典型實現:向量數據庫(Milvus)、Redis/ES
-
身份認證與權限控制
-
企業級 SSO、AD/LDAP、API網關鑑權
-
確保智能體任務執行可控、可審計
-
工具與執行層
-
RPA、OCR、知識庫、企業系統API
-
智能體的“手腳”,完成具體任務
-
智能體編排與調度(Orchestration)
-
多智能體協作、任務拆解、工具路由
-
只有少部分是AI推理,大部分是工程邏輯和任務管理
-
可觀測與日誌追溯
-
任務狀態監控、錯誤處理、操作日誌
-
B端智能體必須“看得見它在幹活”,否則無法信任
-
數據與基礎設施
-
ETL、數據庫、向量庫、雲原生容器、GPU/CPU集羣
-
保障性能、可擴展性和低成本運行
總結:水面下的 90% 負責讓智能體“落地、穩定、可控、可追溯”,而非展示“聰明”。
三、為什麼這個比例對企業落地很重要
- 防止高估AI能力
- 只關注模型而忽視工程建設,智能體很快失效或不可控
- 指導架構設計
-
把智能體當作軟件系統,而不是單個模型
-
先規劃好 Workflow、權限、數據、日誌、工具集成
-
明確團隊建設方向
-
90% 的工作需要軟件工程、架構、運維人才
-
只有 10% 是 Prompt、模型微調或推理優化
-
解釋為什麼B端落地難、C端快
-
C端重體驗,輕工程,冰山頂部就能跑 MVP
-
B端重交付,必須把冰山底部的 90% 建完整