今天給大家分享的是一個白皮書,長達156頁,20w字,阿里的雲棲大會上發佈的,由40位一線工程師聯合撰寫。
叫做《AI原生應用架構白皮書》。
我看了看。
裏面有關AI的東西,是非常的全,我認為這是目前入門AI最好的一本書。
我們平時聽説過的熱詞,在這裏全都有詳細的解釋,甚至是來龍去脈,講得都非常透徹和真實。
我很早就開始做智能化相關的東西,平時也積累了很多這方面的知識。
這裏面説的東西,我基本上都瞭解過。
我知道他們説的對,所以我才特別開一篇文章來講一下這個白皮書。
讓大家能夠系統性、全面地瞭解AI。
特別是大模型和智能體這方面。
大家看到這裏,可以去公眾號回覆”大會“兩字,就可以獲得原版白皮書的文件下載鏈接了。
不過,建議你們繼續讀下去。
我接下來要説兩個事:
一是,我會解讀一下這份白皮書,主要講講這裏面説了什麼重要的東西。
二是,有關AI自媒體的文章質量的事,教大家怎麼確定文章質量和識別AI文章。
我先説第一個事,大概講解下白皮書的內容。
2025年,過年期間,DeepSeek爆紅之後,AI就逐漸走進了大眾的視野。
再加上Manus的出圈,AI真可謂是當前最熱的話題。
以至於,各家公司都在做智能化相關的事。
甚至是政府、國企等各單位都在積極推進智能化。
所以,AI一定是一個趨勢,我堅信至少3-5年內會一直保持相當高的熱度。
但是,AI的發展是如此之快。
即使是我每天關注AI,也被弄的眼花繚亂。
有一段時間,我都感覺到了疲憊,甚至是恐慌。
AI的新鮮事物真就如雨後春筍一般,並且一天一個樣。
東西太多了,沒有幾個人把這些東西串起來過。
我之前一直想搞這個,但是沒時間。
但是,這個白皮書就是做了這樣一件事,把所有大模型和Agent相關的東西都做了解釋,非常厲害。
如果你也想早點入門AI,可以把這本書反覆的看。
如果有不懂的,可以私聊我,或者加入我的羣聊,給你解答。也希望你能關注我,給我支持。
01
《AI原生應用架構白皮書》總結
1. 參編人員
白皮書有40多位一線工程師共同撰寫,都來自阿里巴巴。
下面是參編人員列表(這是他們在阿里的花名)(這裏面有幾位大佬我接觸過,在維護一些框架,如spring-ai-alibaba):彥林、亦盞、穆飛、麻芃、望宸、楊濤、小取、昔比、陸龜、席翁、翼嚴、濯光、十眠、如漫、青塘、佳皓、文昀、嚴研、葉仔、梧同、聰言、如葑、計緣、澄潭、洵沐、不銘、不瞋、世如(這裏本來是個截圖的,後來發現沒放上,有字數修改限制,先列舉上這幾位大佬)
2. 章節劃分
白皮書一共分了11章,分別是:
第1章:AI原生應用及其架構
第2章:AI原生應用的關鍵要素
第3章:AI應用開發框架
第4章:上下文工程
第5章:AI工具
第6章:AI網關
第7章:AI應用運行時
第8章:AI觀測
第9章:AI評估
第10章:AI安全
第11章:通向ASI之路
可以看到,白皮書裏面主要講的就是:如何用AI給我們的傳統應用賦能,以及如何落地的方案。
從智能應用的開發、測試、上線和運維的完整應用生命週期。
我讀完之後,能夠發現,他們是在圍繞着企業級的智能場景落地做了一個全面的講解。
我只能説,AI的東西,還是在前期發展階段,很多東西還是不確定,不成熟。
雖然目前的做法是正確的,但是依舊處於動態變化當中。
我估麼着,再有一年,可能很多東西都已經確定下來了,也會有很多的優秀的產品出來。
3. 國內的智能應用落地情況
書裏對國內的智能應用落地情況做了調研。
基於調研的數據,我們可以看到:
44%的企業正在做智能化應用。
30%上下的企業會選擇使用開源的產品或者框架。
落地的場景大概分四個方向:
- 提升工作效率。
- 智能交互。
- 流程智能處理。
- 科技創新。
智能體方面:62%的場景還是單智能體。
我覺得這是歷史遺留問題,主要因為當時大模型能力不行,單智能體已經夠嗆了。
多智能體方面,現在還確實存在很大的編排機制問題,協作效果並沒有想當然的那麼好,落地沒有想象中的那麼簡單。
不過隨着AI的發展,相信在明年,一定會有很大進步。今天才剛剛過去9個多月,AI的表現就已經翻了好幾倍。
工具方面:63%的企業已經沉澱了一些工具(包含MCP),給智能體用,增強智能體的表現。
目前面臨的挑戰,他們列了四個,但是我覺得,有點帶貨的意思。
除了第一個,連續對話,是由於大模型上下文長度固有的問題。
其他的都可以歸結為傳統的服務治理的問題,只不過當前的服務是和AI相關的設施。
估計,是想着推一下自家的Higress網關和Nacos服務中心。
當然,沒毛病,我個人覺得,除了智能體內部的機制問題,這些傳統的問題用傳統的優秀中間件處理,很合適。
而且,這也體現了中間件的可複用性,擴展性。
4. 新架構:AI原生應用架構
他們提了一個新的架構:AI原生架構。
我覺得這個架構很大,很新,但是隻是一個趨勢,還在積極構建,還有很長一段路要走。
目前,我們企業級的應用架構經歷了這樣的變化:
單體架構、 垂直架構、面向服務架構(SOA),微服務架構、雲原生架構。
給我的一種感覺就是:他們想表達的意思是,以後的應用架構會是Agent驅動的,一切都是Agent,擁有自主管理能力。
下面是架構圖,似乎想表達:
我們通過手機,用的是自然語言,交互的是Agent,Agent處理好後台的細節,Agent之間也會協作完成我們的訴求。
聽起來,感覺不錯。
當然,這裏面也帶上了阿里的各種中間件。
最後,還給架構的做了一個成熟度的劃分,有點像OpenAI做的智能體水平等級。
反正,我覺得挺好,很有可能不久的未來就能實現。
我很看好這個架構,因為,我感覺,這是可以實現的。
核心在於智能體,以及多智能體的協作。
所謂智能的落地,就是讓需要用人的地方,讓智能代替。
智能體能勝任這個工作嗎?
大家覺得呢?
我覺得肯定能,智能體可比咱們普通人聰明的多,能幹,還不用管飯。
24小時不間斷。
天生的打工勝體。
5. 智能應用的關鍵要素
書裏的第二章專門介紹了我們所熟知的那些智能體相關的概念。
包括:模型、框架、提示詞、RAG、記憶、工具、網關、運行時、可觀測、評估、安全。
我分別解釋一下:
模型:就是模型能力,可能包含大模型(大小參數量的都有)、多模態的模型(包括OCR識別這種)、語音模型等,真正落地的智能體應用系統,不可能只用一個大模型。
框架:就是你做Agent的核心處理邏輯,有個架子,開發者用低代碼或者硬編碼,寫自己的提示詞、做工具、做知識等。還包括智能體的範式,比如ReAct(推理+行動)。
提示詞:提示詞很關鍵,是最重要的核心,沒有之一,是智能體處理要遵循的指令。説白了,就是讓智能體聽話,按照咱説的做。智能體可以理解為張飛:“大哥,你説吧,讓俺怎麼幹”。
RAG:就是知識檢索。知識庫搜索(傳統搜索、向量化)和網絡搜索都屬於RAG的範疇。只要能獲取到大模型本身不具備的實時內容,就是RAG。RAG機制本身也得優化,檢索出來的東西不一定都有用。
記憶:有短期和長期的區別。短期就是當前會話,也就是上下文。長期目前來看,就是由短期積累而來的,比如説用户喜好、不經常變動的內容。
工具:這是智能體的核心能力之一,能夠用工具,就有了操縱現有系統和現實世界的能力。目前MCP協議基本上就是工具標準,人家先出道了,但是後面可能會變成別的。
網關:就是傳統的網關,不過現在用來Agent調用、統一模型調用,敏感內容過濾,成本控制等。
運行時:就是AI需要的周邊設施或者服務:比如數據服務、GPU服務、業務服務等。
可觀測:智能體的表現,大家都清楚,很有可能不穩定,所以觀察智能體的表現,各項指標,對於改進優化就尤為重要。
評估:可上面的可觀測是一塊的,觀測完了之後做智能體的評測,逐漸讓他穩定下來,跟模型訓練一樣,練好了考個試。
安全:每個事物都得有安全方面的考慮,智能體更是。比如:模型越獄、生成釣魚信息、數據安全、用户隱私、商業機密等,都是要考慮的。這塊目前很欠缺。
書中講的很細,大家也可以仔細看看,瞭解瞭解,這一塊是做智能應用必備的知識。
但是,感覺可能我覺得説的很好,是因為我都比較熟悉了,看到他們整的這麼全,所以很欣喜地推薦給大家。
初學者真有可能看起來頭大,並不覺得有多好。
有什麼問題可以加羣交流,或者去看看我的另一篇文章,關於智能體開發的最佳實踐。
一萬兩千字,解讀智能應用開發最佳實踐
這裏面説的還是比較通俗易懂的,給我的同事講了一會,他就明白的差不多了。
6. 智能體的定義和範式
第三章講的是智能體是什麼、以及當前的各種智能體的模版,我們稱之為範式。
所謂的智能體,大多在模仿人類在設計,可以理解用大模型充當一個真正的人,能夠獨立的解決問題。
他們是這樣定義智能體的:
當然,智能體就像我説的,沒那麼玄乎。就把它當成人就行。
感知就是身體,讓他能知道所處的環境(工作場景)。
規劃和推理就是大腦(魚的記憶,只有七秒),是大模型本身的能力,他記不住你跟他説過什麼,只能你記下來給他看。
記憶就是一個記事本,讓他能夠看到自己做過啥,説過啥。
工具:就是他的手和腳,能夠做事。
反饋和迭代:就是他跟你説的話,讓你確認。
智能體的定義,沒有那麼死板,你想怎麼説就怎麼説。
如果初學者實在不理解智能體的這些要素。
建議去使用API,調用一次大模型。你就全理解了。
**做一個單智能體,基本上就是上面説的這些內容的拼湊。**如下圖:
還有一種智能體,是用工作流做出來的,包含一系列處理過程,把這些過程串起來,中間存在多次模型調用。如下圖:
還有一種叫路由智能體,就跟銀行的大廳經理一樣,問客户辦什麼業務,引導到對應的窗口。
還有很多智能體的架構,但基本上都是基於對人類處理事情的方式和協作機制進行設計的。如下圖。
Google有個A2A協議,就是智能體協同的協議。
阿里就用Nacos中間件來管理這些智能體的註冊,作為實現A2A的一個設施基礎。
為了處理好人與Agent之間的消息交互、Agent與Agent之間的消息交互,他們又用了RocketMQ消息隊列來實現消息的管理。
7. 上下文工程
書中又為上下文工程單開了一章,足以説明上下文工程的重要性。
上下文工程是提示詞工程的延伸和增強。
大家不要被這些概念給嚇住,感覺學不完了。
其實就是提示詞的分區化管理、動態構建。
本質還是提示詞,不過更精細化了。
我之前也寫過一篇上下文工程的解析文章,可以去看看。
書中對於上下文工程和提示詞工程的區別是這樣:
書中對於上下文的構成是這樣理解的:
然後,又重點講了RAG的優化。
包括:
文檔分塊的策略:文檔向量化之前,要先分塊,分成一段段的文本塊。向量搜索的結果就是文檔塊。所以分成多大的塊,從哪裏到哪裏分成一段,是個策略,影響召回的內容。
查詢改寫、問題分解:就是把非專業的自然語言,轉化成專業的術語,有利於匹配,增強檢索的質量。
多路召回和混合檢索:就是從多個數據源和方式把知識檢索出來,防止單一數據源的檢索效果不夠好。
重排序:對於搜索結果,把與問題最相關的放在最前面,需要有個排序的過程。排序可以是讓算法排序,也可以是讓大模型排序。
Agentic RAG:就是讓另一個智能體進行檢索,他的任務就是把和這個問題相關的內容給找出來。
多模態RAG:支持以圖搜文,以文搜索,綜合檢索。
GraphRAG:就是知識圖譜,把所有概念建立起聯繫,形成知識網絡,從其中一個概念開始,能提起來一連串的相關知識點。
知識圖譜似乎是最理想的方式,並且是非常適合企業構建自己的知識網絡。
但是治理難度很大,書中也是這麼説的。
上下文壓縮也説了。
目前有Cline和ClauddeCode內置了上下文自動壓縮,就是讓大模型總結下之前的對話,再清空上下文,把總結帶入新對話中。
然後繼續對話,能夠解決上下文長度超限的問題。
不過他們提的更完整。
上下文管理的處理策略有:寫入、選擇、壓縮、隔離。
講的就是上下文的存取、壓縮和不同智能體之間的上下文隔離。
同時,也提了多層記憶:短期記憶轉長期記憶。
8. 工具方面
工具方面主要介紹了MCP協議,説了它的優勢和不足。
優勢是:統一了工具接入的方式。
劣勢就是:協議在安全方面的不足,在大批量工具下影響模型性能的問題,在集中管理方面的問題。
安全問題方面:
他們通過AI網關來解決MCP鑑權的問題。
批量工具應用方面:
他們通過網關檢測,當檢測到模型調用中含有大量的工具時,會用工具語義化檢索來自動精簡工具列表。這個特性是可以開啓關閉的。
對於很多的MCP Server,會根據用户提問,動態選擇最符合當前場景的MCP Server,防止過多的工具導致模型分析能力下降。
這個能力官方叫做MCP Router。有意思的是MCP Router本身也是個MCP Server。
其實就是根據問題,讓Agent去調用這個MCP Router,動態檢索出可能會用到的MCP Server。
有點類似大模型的MOE架構(專家模型),把大模型內部分成10幾個專家,根據用户問題,選擇最合適的專家,而不用全軍出動。
對於MCP服務的管理,包括配置、發佈、市場化等,他們開發了HiMarket來管理。
9. AI網關
這個我就不多贅述了,和傳統的網關區別不大。
10. AI運行時(Serverless)
這部分,基本上,就是在推Serverless,也就是雲函數計算。
官方説是這種比較適合Agent場景,比方説:會話隔離、工具執行(沙箱)、Agent彈性計算(毫秒響應)。
我倒覺得這個Serverless反正推起來有點困難,可能真正適用的場景比較少,就那麼幾個。
因為這個概念推出很長時間了,在雲原生後期,就開始提,似乎企業中真正使用的比較少。
也可能是我看的少,大家感興趣的可以看看。
我只能説,因地制宜,有適合Serverless發揮作用的地方,就用,不要強行整上。
11. AI的可觀測
AI的運行狀態,智能體的處理過程,鏈路追蹤,不僅僅是在開發時便於我們調試智能體,更是在運行時能夠找出智能體出錯的原因。
這和傳統的服務器應用觀測沒有本質區別。
主要是為了AI應用的高可用。
他們基於OpenTelemetry這個標準的遙測協議,在智能場景下所有需要觀測的地方做了埋點。
實現了鏈路插樁、鏈路採集與加工、Trace查詢與分析等。
基本上發揮了阿里在服務治理這方面的經驗積累。
也就是説,你(開發者或實施人員)能夠看到用户説了啥、模型返回了啥、工具調用的發起和結果、種種細節。
12. AI評估
AI評估就是評測智能體的表現。
這塊,書裏其實就説了一個設想,做了一個等級劃分。
其實AI評估這塊,一直沒人做,可能就是沒太有時間,大家都在忙着開發智能場景。
13. AI安全方面
安全肯定是重中之重,但是這方面,大家都是剛起步。
防不勝防啊,安全是永遠的話題。
目前,大家的防範措施基本上都是在網關層做一層基礎的攔截。
真正精細化的安全管理,還有很長的路要走。
目前還是先讓AI做起來再説。
書裏面也説了一些AI常見的安全問題,感興趣的可以去看看。
14. 通往ASI之路
這裏有點不太正經哈。
S居然是Super(超級)的意思。
最後一章就是展望未來,我這裏直接就貼上一部分了。
關於這本白皮書的解析到這裏就結束了。
需要白皮書原文件的同學,需要關注下公眾號,在公眾號回覆:“大會”兩字即可。或者加羣也可以。
我們簡單總結下:
這本書其實講述的AI的基礎知識,以及企業如何讓智能應用落地,他們給出了一個全面的解決方案。
這個解決方案裏,有成熟的,有構想的,有展望的,可以看出來編者們都很用心,也非常專業。
感謝各位編者,同時向所有AI工作者致敬🫡。
02
辨別文章質量
我在文章開頭説道:”我知道他們説的對,所以我才特別開一篇文章來講一下這個白皮書。“
我為什麼要特別強調”我知道他們説的對“這件事。
因為,我作為一個AI領域的博主,我見過太多的”垃圾“文章爆火。
就是大家都不太熟悉AI,AI爆火也才還不到一年,對大家來説,是陌生的,新事物,未知的。
這種情況下,你無法辨別誰説的對。
今天,xxx火了,明天,另一個概念又火了。
自媒體就跟餓狼似的,抓住一個熱點就蹭,好多做AI相關的博主,其實都是人云亦云。
看別人怎麼發,他就跟着複製,模仿來發。
更有甚者,就直接拿AI生成的文章來當成自己的見解。
AI生成的,沒毛病,有毛病的是他沒做人工校驗,而更多的情況是,他沒能力做校驗,因為他根本就不知道什麼是什麼。
我説這個,絕對不是為了diss某些博主,而是我曾經真的讀過幾篇這樣的”垃圾“文章。
文章中的內容就是錯誤的,拼湊的,瞎琢磨的。
關鍵是,這種公眾號,還真的火了,至少還真有人點贊轉發。
我只能説,AI處於早期發展當中,大家對它還是陌生,無法判別真假,只是湊個熱鬧。
這樣質量的博主,都能火,都能一直髮文章,況且他還不自知,不感到羞愧,我也是服氣的。
説這麼多,就是想告訴大家一個意識:要主動分別知識的真假。
大家可能會説,我咋分辨,我真沒辦法分辨。
但是,我教給大家一招,能夠分別是否是AI生成內容。
真假分別不出來,沒關係,關注我就行,因為我可以對我發佈的內容負責。
我搞了一年多的智能化,什麼東西我都見過,都去細細研究過,從論文、從作者、從源頭去理解。
話説的有點大,好像有點吹牛,但是我就是有這個自信和能力,哈哈哈哈。
接着説,如何分辨AI生成的內容,這是一個技巧。
這個技巧是:如果這篇文章的大小標題的後面都帶着英文翻譯,並且英文還帶括號,這100%是AI生成的。
如果不是,我倒立洗頭。
就像這種。
我不是説AI生成的內容不好,而是讓大家提高警惕。
你的文章裏面有AI生成的東西,沒毛病,畢竟有些東西AI説的比較專業,覺得對,就可以直接用。
又不是寫論文,不需要這麼高要求。
但如果一篇文章全是這種形式的話,那完全就是AI生成的,你們覺得他都能這麼糊弄讀者,他會是真的在用心做內容嗎?
我對這種行為感到羞愧,欺騙感情。
然後,我説一下,為什麼這個技巧管用。
就是一個正常人寫文章,中國人,是不會在每個標題和副標題,以及子標題中配備上英文解釋的。
正常人寫文章,要麼就是一口氣寫一段,然後理理思路,接着寫。
這期間,基本上不會打斷,這才是有思考的文章。
你覺得正常人寫完之後,會特意在每個標題後面再加上英文?
肯定不會啊。
更別提,在寫的過程中,邊寫邊加英文。多累啊!
你們覺得把標題翻譯成英文,是很簡單的事嗎?大多數人肯定不會去做的,很麻煩,還打斷思路。
而且,大家如果不信,你自己用大模型,讓他給你生成一篇講解XXX的文章。
你看看,是不是跟我説的一樣,各種標題或者列表中後面都帶了英文,而且英文還是括號括起來的。
大家看看我讓通義千問幫我生成一篇講解RAG優化的文章。(通義千問打錢!)
我沒説錯吧,是不是這麼回事。
你換別的模型也一樣的效果。
有人可能會説,你這讓人家博主怎麼活,我可不管,反正我希望我的粉絲是有這樣的能力的。
因為,在未來,可能好多東西都是AI生成的,我們需要具備這樣的能力。
起碼,不至於説是,跟着一個純AI生成的博主,還對他心存感激和敬意,我覺得他不配。
估計啊,好多博主,肯定會拿着這個白皮書的東西,直接複製粘貼發文章,聲稱原創,絕對的!
但是沒辦法,我無法阻止這種行為,只希望我的粉絲們,有這樣的意識就好。
好了,今天的分享到這就結束了。
還是老話,希望大家多點點贊、轉發、在看和喜歡,點點關注。
你們的支持真是給我了很大的動力。