1.1 大模型技術發展回顧和產業價值

1.1.1 大模型發展回顧與展望

2022年11月,ChatGPT橫空出世,模型即服務(MaaS)模式快速興起,AI從實驗室走向商業場景。2024年,OpenAI推出o1模型和4o模型,大模型技術迎來質的飛躍。2025年,多家大模型廠商支持模型上下文協議(MCP),Google推出A2A架構,AI從單點工具向系統級生產力工具轉變。

1.1.2 大模型的五大產業價值

效率新工具、服務新體驗、產品新形態、決策新助手、科研新模式。

1.2 AI時代應用架構的演進

1.2.1 IT應用架構的演進脈絡

【AI白皮書】AI原生應用及其架構_模態

雲原生架構是指,Kubernetes等技術通過容器化、集羣化管理,實現按量使用、秒級彈性的極致資源調度。

每一次架構升級,都是在滿足業務規模更大、需求變化更快、資源成本更低的述求。

1.2.2 雲原生應用架構向AI原生應用架構的躍遷

如果説,雲原生解決的是如何高效地運行,那麼AI原生是在此基礎上解決如何智能地運行。

在雲原生應用架構中,我們討論的是容器如何管理、服務如何拆分、流量如何治理。而在AI原生應用架構下,其目標是在滿足可擴展、可觀測、安全合規的同時,最大化釋放模型的智能潛力。

在大語言模型(LLM)出現之前,AI只能以功能模塊形態嵌入系統。LLM具備通用理解、推理和生成能力,並能通過函數調用、外部工具聯動和知識庫,形成可擴展的Agent體系。AI原生應用的運行邏輯不再完全由工程師編寫的代碼所決定,而是由大模型進行自出判斷、行動和生成,並具備以下3個特徵:

  • 以LLM為核心,用自然語言統一交互協議;
  • 以多模態感知擴展輸入邊界,以Agent框架編排工具鏈;
  • 以數據飛輪驅動模型持續進化,實現系統的自我優化。

1.3 AI原生應用及其架構的定義

【AI白皮書】AI原生應用及其架構_模態_02

AI原生應用架構,涵蓋了模型、應用開發框架、提示詞、RAG、記憶、工具、網關、運行時、可觀測、評估和安全等關鍵要素。

1.3.1 大模型推理決策

傳統應用使用編程語言(Java、C++等)進行編碼,AI原生應用使用大語言模型(LLM),通過Prompt(提示詞)等自然語言方式進行構建。

LLM具有語義理解與推理方面的能力,能夠在面對模糊和複雜的開放式任務時,自主生成和調整業務執行邏輯,並根據需要完成工具調用與流程編排。

1.3.2 Agent編排和執行

傳統應用是工具,Agent是助手。單Agent無法完成複雜任務時,可以協同多Agent編排完成複雜任務。自身能力受限時,可以擴展工具,甚至自己編寫工具完成任務。

1.3.3 數據優化決策

模型輸出可能存在偏差,甚至在某些情況下完全不符合用户或業務方的預期。為了解決這個問題,AI原生應用必須具備基於數據驅動的持續進化能力。在多輪交互中,持續保留並利用歷史信息,理解用户的偏好、行為習慣與目標。同時,應用還需要通過數據採集構建高質量的評測數據集,並結合行業數據、用户反饋數據和客户業務數據進行持續評估與優化。

1.3.4 工具調用與環境連接

大語言模型運行機制的本質仍是基於“輸入Token→輸出Token”的序列生成過程。受限於這一機制,模型既無法直接感知外部環境,也無法獲取實時更新的知識,更缺乏對物理世界的直接操控能力。

AI原生應用通常通過工具調用的方式擴展模型的環境連接能力。一是支持語音、圖像乃至動作等多模態輸入;二是支持聯網檢索獲取最新信息,並且通過API對接外部系統,或直接驅動企業內部系統的業務流程。“模型+工具”協同運行。

1.4 AI原生應用架構成熟度

1.4.1 AI原生應用架構成熟度的定義

AI原生應用架構成熟度,是指用於綜合衡量AI原生應用在技術實現、業務融合與安全可信等方面所達到的水平,客觀反映其從簡單功能集成到複雜智能決策的演進階段與發展層次。

1.4.2 AI原生應用架構成熟度的演進

【AI白皮書】AI原生應用及其架構_原生應用_03

1、概念驗證級:單點功能輔助

2、早期試用級:場景化初步閉環

3、成熟應用級:核心業務深度集成

4、完全成熟級:企業級自適應迭代

1.4.3 AI原生應用架構成熟度的評估

以五大能力特徵作為核心評估維度:自然語言交互能力、多模態理解與生成能力、動態推理與自主決策能力、持續學習與迭代能力、安全可信。

本評估體系旨在為AI原生應用的規劃、開發、部署與優化提供一套完整的診斷工具和行動指南,最終推動其從概念驗證走向規模化、高價值的產業應用。

參考資料:

https://developer.aliyun.com/ebook/8479