過去兩年,AI智能體(AI Agent)成為AI落地的熱門方向。從 ChatGPT 的對話助手,到自動化辦公、代碼助手,再到多智能體協作平台,智能體被視為未來人機交互的核心形態。

然而在實際落地中,很多企業會發現一個殘酷現實:

構建一個真正可用的智能體,90% 的工作是軟件工程,只有 10% 才是 AI。

這一觀點最早由 Rakesh Gohel 在其著名的AI Agent冰山模型中提出,並在業內引發了廣泛共鳴。本文將深入解析這背後的邏輯。

智能體架構的真相:90%是軟件工程,10%是AI_AIGC

圖來源:Rakesh Gohel(linkedin)

一、為什麼智能體是 90% 軟件工程、10% AI?

表面上,智能體看起來只是一個能理解自然語言、會自動生成結果的“大模型應用”。但真正的企業級智能體落地,遠不止一個 LLM:

  1. AI 模型只解決“腦子”的問題
  • 理解任務、規劃步驟、生成內容或結果
  • 這一部分就是“10% AI”
  1. 軟件工程支撐智能體的整個“身體和神經系統”
  • 用户交互、權限控制、任務編排、數據流轉、工具調用、日誌監控、異常回滾

  • 這些工作是“90% 軟件工程”,沒有它們,智能體無法穩定運行

用一句話概括:

AI 決定智能體“懂不懂”,軟件工程決定它“能不能幹活”。

二、AI智能體的冰山模型

為了直觀説明這 90/10 的關係,我們可以用冰山模型來理解智能體架構:

1. 水面上的 10%:用户可見的 AI

  • 內容:自然語言交互、意圖理解、文本/代碼/報表生成
  • 典型體驗
  • C端:ChatGPT、文心一言、通義千問、Cursor
  • B端:智能工單助手、報銷自動審核、代碼自動補全
  • 核心能力
  • 大模型(LLM)語義理解與生成

  • 基礎任務規劃與工具選擇

用户看到的“智能”部分,其實只是冰山一角。

2. 水面下的 90%:支撐智能體運行的軟件工程

這部分是企業真正的建設難點,主要包括:

  1. 前端與交互層
  • Web端、移動端、企業IM(釘釘/飛書)入口
  • 對話UI、任務面板、狀態可視化
  1. 記憶與上下文管理
  • 長短期對話記憶、任務鏈狀態、文檔緩存

  • 典型實現:向量數據庫(Milvus)、Redis/ES

  1. 身份認證與權限控制

  • 企業級 SSO、AD/LDAP、API網關鑑權

  • 確保智能體任務執行可控、可審計

  1. 工具與執行層

  • RPA、OCR、知識庫、企業系統API

  • 智能體的“手腳”,完成具體任務

  1. 智能體編排與調度(Orchestration)

  • 多智能體協作、任務拆解、工具路由

  • 只有少部分是AI推理,大部分是工程邏輯和任務管理

  1. 可觀測與日誌追溯

  • 任務狀態監控、錯誤處理、操作日誌

  • B端智能體必須“看得見它在幹活”,否則無法信任

  1. 數據與基礎設施

  • ETL、數據庫、向量庫、雲原生容器、GPU/CPU集羣

  • 保障性能、可擴展性和低成本運行

總結:水面下的 90% 負責讓智能體“落地、穩定、可控、可追溯”,而非展示“聰明”。

三、為什麼這個比例對企業落地很重要

  1. 防止高估AI能力
  • 只關注模型而忽視工程建設,智能體很快失效或不可控
  1. 指導架構設計
  • 把智能體當作軟件系統,而不是單個模型

  • 先規劃好 Workflow、權限、數據、日誌、工具集成

  1. 明確團隊建設方向

  • 90% 的工作需要軟件工程、架構、運維人才

  • 只有 10% 是 Prompt、模型微調或推理優化

  1. 解釋為什麼B端落地難、C端快

  • C端重體驗,輕工程,冰山頂部就能跑 MVP

  • B端重交付,必須把冰山底部的 90% 建完整