阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生詳情 - AI-native,人工智能,自然語言處理,大模型應用,LLM,數據結構與算法,人工智能索姆拉博客

今天給大家分享的是一個白皮書，長達156頁，20w字，阿里的雲棲大會上發佈的，由40位一線工程師聯合撰寫。

叫做《AI原生應用架構白皮書》。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#人工智能

我看了看。

裏面有關AI的東西，是非常的全，我認為這是目前入門AI最好的一本書。

我們平時聽説過的熱詞，在這裏全都有詳細的解釋，甚至是來龍去脈，講得都非常透徹和真實。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#LLM_02

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#自然語言處理_03

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#大模型應用_04

我很早就開始做智能化相關的東西，平時也積累了很多這方面的知識。

這裏面説的東西，我基本上都瞭解過。

我知道他們説的對，所以我才特別開一篇文章來講一下這個白皮書。

讓大家能夠系統性、全面地瞭解AI。

特別是大模型和智能體這方面。

大家看到這裏，可以去公眾號回覆”大會“兩字，就可以獲得原版白皮書的文件下載鏈接了。

不過，建議你們繼續讀下去。

我接下來要説兩個事：

一是，我會解讀一下這份白皮書，主要講講這裏面説了什麼重要的東西。

二是，有關AI自媒體的文章質量的事，教大家怎麼確定文章質量和識別AI文章。

我先説第一個事，大概講解下白皮書的內容。

2025年，過年期間，DeepSeek爆紅之後，AI就逐漸走進了大眾的視野。

再加上Manus的出圈，AI真可謂是當前最熱的話題。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#AI-native_05

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#AI-native_06

以至於，各家公司都在做智能化相關的事。

甚至是政府、國企等各單位都在積極推進智能化。

所以，AI一定是一個趨勢，我堅信至少3-5年內會一直保持相當高的熱度。

但是，AI的發展是如此之快。

即使是我每天關注AI，也被弄的眼花繚亂。

有一段時間，我都感覺到了疲憊，甚至是恐慌。

AI的新鮮事物真就如雨後春筍一般，並且一天一個樣。

東西太多了，沒有幾個人把這些東西串起來過。

我之前一直想搞這個，但是沒時間。

但是，這個白皮書就是做了這樣一件事，把所有大模型和Agent相關的東西都做了解釋，非常厲害。

如果你也想早點入門AI，可以把這本書反覆的看。

如果有不懂的，可以私聊我，或者加入我的羣聊，給你解答。也希望你能關注我，給我支持。

01

《AI原生應用架構白皮書》總結

1. 參編人員

白皮書有40多位一線工程師共同撰寫，都來自阿里巴巴。

下面是參編人員列表（這是他們在阿里的花名）（這裏面有幾位大佬我接觸過，在維護一些框架，如spring-ai-alibaba）：彥林、亦盞、穆飛、麻芃、望宸、楊濤、小取、昔比、陸龜、席翁、翼嚴、濯光、十眠、如漫、青塘、佳皓、文昀、嚴研、葉仔、梧同、聰言、如葑、計緣、澄潭、洵沐、不銘、不瞋、世如（這裏本來是個截圖的，後來發現沒放上，有字數修改限制，先列舉上這幾位大佬）

2. 章節劃分

白皮書一共分了11章，分別是：

第1章：AI原生應用及其架構

第2章：AI原生應用的關鍵要素

第3章：AI應用開發框架

第4章：上下文工程

第5章：AI工具

第6章：AI網關

第7章：AI應用運行時

第8章：AI觀測

第9章：AI評估

第10章：AI安全

第11章：通向ASI之路

可以看到，白皮書裏面主要講的就是：如何用AI給我們的傳統應用賦能，以及如何落地的方案。

從智能應用的開發、測試、上線和運維的完整應用生命週期。

我讀完之後，能夠發現，他們是在圍繞着企業級的智能場景落地做了一個全面的講解。

我只能説，AI的東西，還是在前期發展階段，很多東西還是不確定，不成熟。

雖然目前的做法是正確的，但是依舊處於動態變化當中。

我估麼着，再有一年，可能很多東西都已經確定下來了，也會有很多的優秀的產品出來。

3. 國內的智能應用落地情況

書裏對國內的智能應用落地情況做了調研。

基於調研的數據，我們可以看到：

44%的企業正在做智能化應用。

30%上下的企業會選擇使用開源的產品或者框架。

落地的場景大概分四個方向：

提升工作效率。
智能交互。
流程智能處理。
科技創新。

智能體方面：62%的場景還是單智能體。

我覺得這是歷史遺留問題，主要因為當時大模型能力不行，單智能體已經夠嗆了。

多智能體方面，現在還確實存在很大的編排機制問題，協作效果並沒有想當然的那麼好，落地沒有想象中的那麼簡單。

不過隨着AI的發展，相信在明年，一定會有很大進步。今天才剛剛過去9個多月，AI的表現就已經翻了好幾倍。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#自然語言處理_07

工具方面：63%的企業已經沉澱了一些工具（包含MCP），給智能體用，增強智能體的表現。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#人工智能_08

目前面臨的挑戰，他們列了四個，但是我覺得，有點帶貨的意思。

除了第一個，連續對話，是由於大模型上下文長度固有的問題。

其他的都可以歸結為傳統的服務治理的問題，只不過當前的服務是和AI相關的設施。

估計，是想着推一下自家的Higress網關和Nacos服務中心。

當然，沒毛病，我個人覺得，除了智能體內部的機制問題，這些傳統的問題用傳統的優秀中間件處理，很合適。

而且，這也體現了中間件的可複用性，擴展性。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#AI-native_09

4. 新架構：AI原生應用架構

他們提了一個新的架構：AI原生架構。

我覺得這個架構很大，很新，但是隻是一個趨勢，還在積極構建，還有很長一段路要走。

目前，我們企業級的應用架構經歷了這樣的變化：

單體架構、垂直架構、面向服務架構（SOA），微服務架構、雲原生架構。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#大模型應用_10

給我的一種感覺就是：他們想表達的意思是，以後的應用架構會是Agent驅動的，一切都是Agent，擁有自主管理能力。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#AI-native_11

下面是架構圖，似乎想表達：

我們通過手機，用的是自然語言，交互的是Agent，Agent處理好後台的細節，Agent之間也會協作完成我們的訴求。

聽起來，感覺不錯。

當然，這裏面也帶上了阿里的各種中間件。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#自然語言處理_12

最後，還給架構的做了一個成熟度的劃分，有點像OpenAI做的智能體水平等級。

反正，我覺得挺好，很有可能不久的未來就能實現。

我很看好這個架構，因為，我感覺，這是可以實現的。

核心在於智能體，以及多智能體的協作。

所謂智能的落地，就是讓需要用人的地方，讓智能代替。

智能體能勝任這個工作嗎？

大家覺得呢？

我覺得肯定能，智能體可比咱們普通人聰明的多，能幹，還不用管飯。

24小時不間斷。

天生的打工勝體。

5. 智能應用的關鍵要素

書裏的第二章專門介紹了我們所熟知的那些智能體相關的概念。

包括：模型、框架、提示詞、RAG、記憶、工具、網關、運行時、可觀測、評估、安全。

我分別解釋一下：

模型：就是模型能力，可能包含大模型（大小參數量的都有）、多模態的模型（包括OCR識別這種）、語音模型等，真正落地的智能體應用系統，不可能只用一個大模型。

框架：就是你做Agent的核心處理邏輯，有個架子，開發者用低代碼或者硬編碼，寫自己的提示詞、做工具、做知識等。還包括智能體的範式，比如ReAct（推理+行動）。

提示詞：提示詞很關鍵，是最重要的核心，沒有之一，是智能體處理要遵循的指令。説白了，就是讓智能體聽話，按照咱説的做。智能體可以理解為張飛：“大哥，你説吧，讓俺怎麼幹”。

RAG：就是知識檢索。知識庫搜索(傳統搜索、向量化)和網絡搜索都屬於RAG的範疇。只要能獲取到大模型本身不具備的實時內容，就是RAG。RAG機制本身也得優化，檢索出來的東西不一定都有用。

記憶：有短期和長期的區別。短期就是當前會話，也就是上下文。長期目前來看，就是由短期積累而來的，比如説用户喜好、不經常變動的內容。

工具：這是智能體的核心能力之一，能夠用工具，就有了操縱現有系統和現實世界的能力。目前MCP協議基本上就是工具標準，人家先出道了，但是後面可能會變成別的。

網關：就是傳統的網關，不過現在用來Agent調用、統一模型調用，敏感內容過濾，成本控制等。

運行時：就是AI需要的周邊設施或者服務：比如數據服務、GPU服務、業務服務等。

可觀測：智能體的表現，大家都清楚，很有可能不穩定，所以觀察智能體的表現，各項指標，對於改進優化就尤為重要。

評估：可上面的可觀測是一塊的，觀測完了之後做智能體的評測，逐漸讓他穩定下來，跟模型訓練一樣，練好了考個試。

安全：每個事物都得有安全方面的考慮，智能體更是。比如：模型越獄、生成釣魚信息、數據安全、用户隱私、商業機密等，都是要考慮的。這塊目前很欠缺。

書中講的很細，大家也可以仔細看看，瞭解瞭解，這一塊是做智能應用必備的知識。

但是，感覺可能我覺得説的很好，是因為我都比較熟悉了，看到他們整的這麼全，所以很欣喜地推薦給大家。

初學者真有可能看起來頭大，並不覺得有多好。

有什麼問題可以加羣交流，或者去看看我的另一篇文章，關於智能體開發的最佳實踐。

一萬兩千字，解讀智能應用開發最佳實踐

這裏面説的還是比較通俗易懂的，給我的同事講了一會，他就明白的差不多了。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#自然語言處理_13

6. 智能體的定義和範式

第三章講的是智能體是什麼、以及當前的各種智能體的模版，我們稱之為範式。

所謂的智能體，大多在模仿人類在設計，可以理解用大模型充當一個真正的人，能夠獨立的解決問題。

他們是這樣定義智能體的：

當然，智能體就像我説的，沒那麼玄乎。就把它當成人就行。

感知就是身體，讓他能知道所處的環境（工作場景）。

規劃和推理就是大腦（魚的記憶，只有七秒），是大模型本身的能力，他記不住你跟他説過什麼，只能你記下來給他看。

記憶就是一個記事本，讓他能夠看到自己做過啥，説過啥。

工具：就是他的手和腳，能夠做事。

反饋和迭代：就是他跟你説的話，讓你確認。

智能體的定義，沒有那麼死板，你想怎麼説就怎麼説。

如果初學者實在不理解智能體的這些要素。

建議去使用API，調用一次大模型。你就全理解了。

**做一個單智能體，基本上就是上面説的這些內容的拼湊。**如下圖：

還有一種智能體，是用工作流做出來的，包含一系列處理過程，把這些過程串起來，中間存在多次模型調用。如下圖：

還有一種叫路由智能體，就跟銀行的大廳經理一樣，問客户辦什麼業務，引導到對應的窗口。

還有很多智能體的架構，但基本上都是基於對人類處理事情的方式和協作機制進行設計的。如下圖。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#人工智能_14

Google有個A2A協議，就是智能體協同的協議。

阿里就用Nacos中間件來管理這些智能體的註冊，作為實現A2A的一個設施基礎。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#大模型應用_15

為了處理好人與Agent之間的消息交互、Agent與Agent之間的消息交互，他們又用了RocketMQ消息隊列來實現消息的管理。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#人工智能_16

7. 上下文工程

書中又為上下文工程單開了一章，足以説明上下文工程的重要性。

上下文工程是提示詞工程的延伸和增強。

大家不要被這些概念給嚇住，感覺學不完了。

其實就是提示詞的分區化管理、動態構建。

本質還是提示詞，不過更精細化了。

我之前也寫過一篇上下文工程的解析文章，可以去看看。

書中對於上下文工程和提示詞工程的區別是這樣：

書中對於上下文的構成是這樣理解的：

然後，又重點講了RAG的優化。

包括：

文檔分塊的策略：文檔向量化之前，要先分塊，分成一段段的文本塊。向量搜索的結果就是文檔塊。所以分成多大的塊，從哪裏到哪裏分成一段，是個策略，影響召回的內容。

查詢改寫、問題分解：就是把非專業的自然語言，轉化成專業的術語，有利於匹配，增強檢索的質量。

多路召回和混合檢索：就是從多個數據源和方式把知識檢索出來，防止單一數據源的檢索效果不夠好。

重排序：對於搜索結果，把與問題最相關的放在最前面，需要有個排序的過程。排序可以是讓算法排序，也可以是讓大模型排序。

Agentic RAG：就是讓另一個智能體進行檢索，他的任務就是把和這個問題相關的內容給找出來。

多模態RAG：支持以圖搜文，以文搜索，綜合檢索。

GraphRAG：就是知識圖譜，把所有概念建立起聯繫，形成知識網絡，從其中一個概念開始，能提起來一連串的相關知識點。

知識圖譜似乎是最理想的方式，並且是非常適合企業構建自己的知識網絡。

但是治理難度很大，書中也是這麼説的。

上下文壓縮也説了。

目前有Cline和ClauddeCode內置了上下文自動壓縮，就是讓大模型總結下之前的對話，再清空上下文，把總結帶入新對話中。

然後繼續對話，能夠解決上下文長度超限的問題。

不過他們提的更完整。

上下文管理的處理策略有：寫入、選擇、壓縮、隔離。

講的就是上下文的存取、壓縮和不同智能體之間的上下文隔離。

同時，也提了多層記憶：短期記憶轉長期記憶。

8. 工具方面

工具方面主要介紹了MCP協議，説了它的優勢和不足。

優勢是：統一了工具接入的方式。

劣勢就是：協議在安全方面的不足，在大批量工具下影響模型性能的問題，在集中管理方面的問題。

安全問題方面：

他們通過AI網關來解決MCP鑑權的問題。

批量工具應用方面：

他們通過網關檢測，當檢測到模型調用中含有大量的工具時，會用工具語義化檢索來自動精簡工具列表。這個特性是可以開啓關閉的。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#人工智能_17

對於很多的MCP Server，會根據用户提問，動態選擇最符合當前場景的MCP Server，防止過多的工具導致模型分析能力下降。

這個能力官方叫做MCP Router。有意思的是MCP Router本身也是個MCP Server。

其實就是根據問題，讓Agent去調用這個MCP Router，動態檢索出可能會用到的MCP Server。

有點類似大模型的MOE架構（專家模型），把大模型內部分成10幾個專家，根據用户問題，選擇最合適的專家，而不用全軍出動。

對於MCP服務的管理，包括配置、發佈、市場化等，他們開發了HiMarket來管理。

9. AI網關

這個我就不多贅述了，和傳統的網關區別不大。

10. AI運行時（Serverless）

這部分，基本上，就是在推Serverless，也就是雲函數計算。

官方説是這種比較適合Agent場景，比方説：會話隔離、工具執行（沙箱）、Agent彈性計算（毫秒響應）。

我倒覺得這個Serverless反正推起來有點困難，可能真正適用的場景比較少，就那麼幾個。

因為這個概念推出很長時間了，在雲原生後期，就開始提，似乎企業中真正使用的比較少。

也可能是我看的少，大家感興趣的可以看看。

我只能説，因地制宜，有適合Serverless發揮作用的地方，就用，不要強行整上。

11. AI的可觀測

AI的運行狀態，智能體的處理過程，鏈路追蹤，不僅僅是在開發時便於我們調試智能體，更是在運行時能夠找出智能體出錯的原因。

這和傳統的服務器應用觀測沒有本質區別。

主要是為了AI應用的高可用。

他們基於OpenTelemetry這個標準的遙測協議，在智能場景下所有需要觀測的地方做了埋點。

實現了鏈路插樁、鏈路採集與加工、Trace查詢與分析等。

基本上發揮了阿里在服務治理這方面的經驗積累。

也就是説，你（開發者或實施人員）能夠看到用户説了啥、模型返回了啥、工具調用的發起和結果、種種細節。

12. AI評估

AI評估就是評測智能體的表現。

這塊，書裏其實就説了一個設想，做了一個等級劃分。

其實AI評估這塊，一直沒人做，可能就是沒太有時間，大家都在忙着開發智能場景。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#自然語言處理_18

13. AI安全方面

安全肯定是重中之重，但是這方面，大家都是剛起步。

防不勝防啊，安全是永遠的話題。

目前，大家的防範措施基本上都是在網關層做一層基礎的攔截。

真正精細化的安全管理，還有很長的路要走。

目前還是先讓AI做起來再説。

書裏面也説了一些AI常見的安全問題，感興趣的可以去看看。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#大模型應用_19

14. 通往ASI之路

這裏有點不太正經哈。

S居然是Super（超級）的意思。

最後一章就是展望未來，我這裏直接就貼上一部分了。

關於這本白皮書的解析到這裏就結束了。

需要白皮書原文件的同學，需要關注下公眾號，在公眾號回覆：“大會”兩字即可。或者加羣也可以。

我們簡單總結下：

這本書其實講述的AI的基礎知識，以及企業如何讓智能應用落地，他們給出了一個全面的解決方案。

這個解決方案裏，有成熟的，有構想的，有展望的，可以看出來編者們都很用心，也非常專業。

感謝各位編者，同時向所有AI工作者致敬🫡。

02

辨別文章質量

我在文章開頭説道：”我知道他們説的對，所以我才特別開一篇文章來講一下這個白皮書。“

我為什麼要特別強調”我知道他們説的對“這件事。

因為，我作為一個AI領域的博主，我見過太多的”垃圾“文章爆火。

就是大家都不太熟悉AI，AI爆火也才還不到一年，對大家來説，是陌生的，新事物，未知的。

這種情況下，你無法辨別誰説的對。

今天，xxx火了，明天，另一個概念又火了。

自媒體就跟餓狼似的，抓住一個熱點就蹭，好多做AI相關的博主，其實都是人云亦云。

看別人怎麼發，他就跟着複製，模仿來發。

更有甚者，就直接拿AI生成的文章來當成自己的見解。

AI生成的，沒毛病，有毛病的是他沒做人工校驗，而更多的情況是，他沒能力做校驗，因為他根本就不知道什麼是什麼。

我説這個，絕對不是為了diss某些博主，而是我曾經真的讀過幾篇這樣的”垃圾“文章。

文章中的內容就是錯誤的，拼湊的，瞎琢磨的。

關鍵是，這種公眾號，還真的火了，至少還真有人點贊轉發。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#LLM_20

我只能説，AI處於早期發展當中，大家對它還是陌生，無法判別真假，只是湊個熱鬧。

這樣質量的博主，都能火，都能一直髮文章，況且他還不自知，不感到羞愧，我也是服氣的。

説這麼多，就是想告訴大家一個意識：要主動分別知識的真假。

大家可能會説，我咋分辨，我真沒辦法分辨。

但是，我教給大家一招，能夠分別是否是AI生成內容。

真假分別不出來，沒關係，關注我就行，因為我可以對我發佈的內容負責。

我搞了一年多的智能化，什麼東西我都見過，都去細細研究過，從論文、從作者、從源頭去理解。

話説的有點大，好像有點吹牛，但是我就是有這個自信和能力，哈哈哈哈。

接着説，如何分辨AI生成的內容，這是一個技巧。

這個技巧是：如果這篇文章的大小標題的後面都帶着英文翻譯，並且英文還帶括號，這100%是AI生成的。

如果不是，我倒立洗頭。

就像這種。

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#自然語言處理_21

我不是説AI生成的內容不好，而是讓大家提高警惕。

你的文章裏面有AI生成的東西，沒毛病，畢竟有些東西AI説的比較專業，覺得對，就可以直接用。

又不是寫論文，不需要這麼高要求。

但如果一篇文章全是這種形式的話，那完全就是AI生成的，你們覺得他都能這麼糊弄讀者，他會是真的在用心做內容嗎？

我對這種行為感到羞愧，欺騙感情。

然後，我説一下，為什麼這個技巧管用。

就是一個正常人寫文章，中國人，是不會在每個標題和副標題，以及子標題中配備上英文解釋的。

正常人寫文章，要麼就是一口氣寫一段，然後理理思路，接着寫。

這期間，基本上不會打斷，這才是有思考的文章。

你覺得正常人寫完之後，會特意在每個標題後面再加上英文？

肯定不會啊。

更別提，在寫的過程中，邊寫邊加英文。多累啊！

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#AI-native_22

你們覺得把標題翻譯成英文，是很簡單的事嗎？大多數人肯定不會去做的，很麻煩，還打斷思路。

而且，大家如果不信，你自己用大模型，讓他給你生成一篇講解XXX的文章。

你看看，是不是跟我説的一樣，各種標題或者列表中後面都帶了英文，而且英文還是括號括起來的。

大家看看我讓通義千問幫我生成一篇講解RAG優化的文章。（通義千問打錢！）

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#自然語言處理_23

阿里雲 - 全新升級！《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生_#LLM_24

我沒説錯吧，是不是這麼回事。

你換別的模型也一樣的效果。

有人可能會説，你這讓人家博主怎麼活，我可不管，反正我希望我的粉絲是有這樣的能力的。

因為，在未來，可能好多東西都是AI生成的，我們需要具備這樣的能力。

起碼，不至於説是，跟着一個純AI生成的博主，還對他心存感激和敬意，我覺得他不配。

估計啊，好多博主，肯定會拿着這個白皮書的東西，直接複製粘貼發文章，聲稱原創，絕對的！

但是沒辦法，我無法阻止這種行為，只希望我的粉絲們，有這樣的意識就好。

好了，今天的分享到這就結束了。

還是老話，希望大家多點點贊、轉發、在看和喜歡，點點關注。

你們的支持真是給我了很大的動力。

本文章為轉載內容，我們尊重原作者對文章享有的著作權。如有內容錯誤或侵權問題，歡迎原作者聯繫我們進行內容更正或刪除文章。

索姆拉博客

索姆拉博客

博客 / 詳情