六大創新時刻解碼 AI for what's Next? 一圖讀懂 Google Cloud Next 25 圖文雙版同步上線❤️
4 月 9 日 - 11 日,全球的目光再次聚焦拉斯維加斯,生成式 AI 在 Google Cloud Next 25 的聚光燈下,呈現出了新的敍事重點——從面向未來的單點技術突破轉向廣泛的當下價值實踐。
現在,讓我們一起回顧大會精華,抓住未來技術脈搏。
新速度💎
Google Cloud 正通過 AI 與雲基礎設施的深度融合,重新定義企業數字化轉型的技術底座。其硬件架構與網絡基建的協同創新,為企業向智能決策與實時響應加速演進注入了新動能。
Ironwood,面向推理時代的首款 Google TPU
Ironwood 的問世,代表着 AI 發展及其底層基礎架構演進的重大轉變。從為人們提供實時信息以供解讀的響應式 AI (responsive AI)模型,轉向能夠主動生成洞察和解讀的模型。這就是我們所説的「推理時代」(age of inference),在這個時代,AI agent 將主動檢索和生成數據,以協同方式提供洞察與解答,而不僅僅是提供數據。
——Amin Vahdat
Google Cloud ML、系統和 Cloud AI 副總裁暨總經理
第七代 TPU Ironwood,是 Google Cloud 迄今為止性能最強、擴展性最高的自研 AI 加速器,專為規模化部署思考型、推理型 AI 模型而設計。
● 性能最強:與首款公開發布的 TPU 相比,Ironwood 的性能提升了 3,600 倍,能效也提高了近 30 倍。
● 擴展性最高:可擴展至 9,216 顆芯片,擁有 42.5 Exaflops 的峯值計算能力,是世界上目前最大的超級計算機的 24 倍以上。
● 高帶寬內存 (HBM) 容量大幅提升:每顆芯片的 HBM 容量高達 192 GB,是 Trillium 的 6 倍。
● HBM 帶寬顯著提高:單芯片帶寬達到 7.37 TB/s,是 Trillium 的 4.5 倍,確保在現代 AI 中,尤其是內存密集型工作負載下,能夠高效運行。
● 增強的芯片間互連 (ICI) 帶寬:雙向帶寬提升至 1.2 TBps,是 Trillium 的 1.5 倍。
Cloud WAN,以 Google 速度助力數字化轉型
Cloud WAN 將徹底改變企業連接和保護其全球基礎設施的方式。Cloud WAN 提供簡便性、高性能、豐富的連接和安全服務選擇,以及顯著的成本節省,讓您專注於雲端及其他領域的創新和發展。
——Muninder Sambi
Google Cloud 雲網絡副總裁
Cloud WAN 是一款跨雲網絡解決方案,與谷歌搜索、Gmail、YouTube 等谷歌自有基礎服務共享同一基礎設施網絡,為企業用户提供高性能、低延遲的連接解決方案。
● 性能提升:相比公共互聯網,Cloud WAN 將跨雲網絡的性能提高了 40%。
● 成本降低:與傳統自建廣域網方案相比,總擁有成本可節省高達 40%。
新力量💎
隨着 Gemini 在企業級場景的應用不斷深入,Vertex AI 的使用量僅過去一年就增長了 20 倍。這次,Google Cloud 不僅推出了注重性能與效益平衡的 Gemini 2.5 Flash,還帶來了 Vertex AI 的全模態能力升級。
Gemini 2.5 Flash,性能與效率兼具
Gemini 2.5 模型現在具備思考能力,能夠在響應之前進行推理,從而顯著提升性能。這種透明的逐步推理對於企業信任和合規性至關重要。
——Jason GelmanGoogle
Cloud Vertex AI 產品管理總監
Tulsee Doshi
Google DeepMind 產品管理總監
Gemini 2.5 Flash 是專為低延遲和成本效益而優化的主力模型,具備動態可控的推理能力,能夠根據查詢的複雜程度調整響應時間,幫助用户在性能和預算之間取得平衡。
● 開發者可以啓用或禁用“推理”功能,從而在質量、成本和延遲之間找到平衡
● 通過調整推理量(最多可使用 24,576 個 token),可以在提高模型準確度的同時,保持較低的成本
● 事實上,Gemini 2.5 Flash 在 LMArena 的難題中表現突出,僅次於 Gemini 2.5 Pro。
VertexAI 持續深入企業級場景
除了 Gemini,我們還擁有一套令人難以置信的生成媒體模型,這些模型正在將效率、創造力和客户參與度提升到新的水平。
——Thomas Kurian
Google Cloud 首席執行官
隨着文本轉音樂模型 Lyria 的推出,Vertex AI 成為目前唯一一個擁有涵蓋所有模態(視頻、圖像、語音和音樂)的生成媒體模型的平台。
● 新推出的 Lyria 是業界首款企業級文本轉音樂模型,能夠製作各種風格的高保真音頻,用於營銷活動、產品發佈、沉浸式店內體驗,或其他數字內容創作配樂。
● Veo 2 新增包括智能擦除、智能擴圖和智能補幀在內的高級編輯功能,以及鏡頭控制能力,可滿足更為複雜的視頻製作需求。
● Chirp 3 新增了僅需 10 秒音頻即可創建自定義語音的功能,並改進了多人説話的轉錄功能,顯著提升會議紀要、播客分析和多方通話錄音等應用的轉錄清晰度和易用性。
● Imagen 3 的修復功能得到了重大改進,可重建圖像中確實或損壞的部分,顯著提升了對象移除的質量,帶來更自然流暢的編輯體驗。
新範式💎
AI 正從單一用途模型向智能自主的多智能體系統邁進。Google Cloud 推出了包括 Agent2Agent (A2A) 協議和開源框架 Agent Development Kit (ADK) 在內的等多項更新,以期加速產業級智能協作生態的構建。
Agent2Agent (A2A),業界首個標準智能體交互協議
無論採用何種底層技術,AI 智能體都可以無縫協作,實現複雜的企業工作流程自動化,並推動前所未有的效率和創新水平。
——Rao Surapaneni
Google Cloud 業務應用平台副總裁兼總經理
Miku Jha
Google Cloud AI/ML 合作伙伴工程總監
Michael VakocGoogle
Cloud 產品經理
Todd Segal
Google Cloud 業務應用平台首席工程師A
Agent2Agent (A2A) 是基於 HTTP、SSE 等通用標準構建的協議,支持企業級驗證和授權,旨在幫助企業突破供應商與框架限制,讓智能體能夠跨平台安全地通信、交換信息並協調行動。
● 能力發現: 允許使用 JSON 格式的“Agent Card”來描述自身功能,從而允許 Client agent 識別能夠執行任務的最佳 Agent 並利用 A2A 與 Remote Agent 進行通信。
● 任務管理:協議定義了“任務”對象及其生命週期,支持短時和長時任務,並確保多智能體在任務進展中保持同步,可靠地傳遞任務的最終產出物。
● 協作通信:A2A 定義了智能體之間發送結構化消息的規範,用以傳遞必要的上下文信息、中間步驟的回覆、最終的“Artifacts”以及來自用户的具體指令。
● 體驗協商:支持智能體之間就最適合向用户或調用方呈現信息的方式進行協商。
Agent Development Kit (ADK),更輕鬆地構建下一代 AI Agent
藉助 ADK,您可以比以往更輕鬆地開始使用由 Gemini 模型和 Google AI 工具驅動的智能體。
——Stephanie Wong
Google Cloud 開發者技能與社區負責人
● 靈活性:ADK 不僅能與各種工具靈活協同,還針對與 Google Cloud 生態系統的無縫集成進行了優化,特別是與 Gemini 模型和 Vertex AI 的無縫集成。
● 多模態:藉助 ADK 獨特的雙相音頻和視頻流式傳輸功能,只需幾行代碼即可創建自然的交互,徹底改變協作方式。
從硬件基礎設施到智能體生態,Google Cloud 在會上帶來了超過 200 項新內容。這些已被驗證的解決方案和麪向未來的價值創新,都是 Google Cloud 對“AI for what's Next?”的迴應——提供更穩定的基建、更強大的模型、更豐富的平台,從而讓 AI 使人人受益。