博客 / 詳情

返回

地平線/智源/字節/凌川科技齊聚上海,共探編譯器優化新進展

2023 年,HyperAI超神經在北京、上海、深圳舉辦了 4 場 Meet TVM 線下聚會,聚集了超 1 千位資深從業者及愛好者,逐步建立了豐富的社區生態。 2024 年,HyperAI超神經聚焦 AI 編譯器領域,繼續為業內人士提供開放的交流平台,在今年 7 月舉辦了 Meet AI Compiler 技術沙龍的第 5 期。如今,2024 年接近尾聲,大模型賽道激戰未停,AI 編譯器有哪些新突破、新應用?

12 月 28 日,HyperAI超神經將在上海五角場舉辦第 6 期 Meet AI Compiler 技術沙龍,本次活動分為技術分享和圓桌討論 2 個環節。

首先,我們有幸邀請到了來自地平線、北京智源人工智能研究院、字節跳動、凌川科技的 4 位資深專家,為大家分享他們的應用案例與行業觀察。此外,上海交通大學博士、Apache TVM PMC 馮思遠將擔任圓桌環節的主持,從專業的技術角度,和嘉賓們進行思維的碰撞。

我們還為大家準備了精美禮品與茶歇,報名活動並關注「HyperAI超神經」公眾號,後台回覆「1228上海」即可參與抽獎, 獎品需在 12 月 28 日當天活動現場線下領取哦,快來參與吧~

活動詳情

時間:12 月 28 日(週六)13:30-17:45

地點:上海五角場創新創業學院 2F 報告廳(楊浦區大學路 322 號)

人數:200(現場座位有限,請儘早報名)

報名:點擊下方鏈接報名

https://hdxu.cn/p2o5

掃碼備註「AI 編譯器」加入活動羣:

在這裏插入圖片描述

議程

在這裏插入圖片描述

嘉賓及議程

環節 1 分享嘉賓

在這裏插入圖片描述

分享主題: Transformer 模型的編譯 & 部署優化實踐

內容簡介:Transformer 模型近年來不僅在 LLM 領域取得了顯著的成果,也在計算機視覺領域得到了廣泛的應用。 在自動駕駛場景中,Transformer 模型的編譯和部署優化是一個複雜的過程,端到端模型、VLM 都對端側的編譯優化和部署提出了非常大的挑戰。本次分享主要介紹地平線在這方面的一些實踐和經驗。

觀看本場分享,你將瞭解:

  1. 視覺 Transformer 模型編譯優化和部署面臨的挑戰
  2. 地平線在 Transformer 模型編譯優化上的探索和實踐

在這裏插入圖片描述

分享主題: FlagGems:研發進展與生態應用探索

內容簡介: 自 2.0 版本發佈以來,在智源團隊、合作廠商及 Triton 中國社區的緊密協作下,FlagGems 在算子支持數量、計算性能、代碼生成以及運行時機制等方面取得了顯著的研發突破。 同時,FlagGems 貫通領域上下游,在大模型訓練與推理適配、多後端芯片集成等方面展開了創新探索,進一步拓展了算子庫在多元生態中的應用場景。

觀看本場分享,你將瞭解:

  1. FlagGems 的最新研發成果和技術提升
  2. 算子庫與大模型適配的創新實踐與經驗
  3. 多後端芯片集成的技術方案與應用效果
  4. Triton 中國社區與多元生態建設進展

在這裏插入圖片描述

分享主題: 從計算-訪存-通信優化看 AI 編譯器設計

內容簡介: 面向 AI 芯片的編譯優化需面臨 3 個角度的優化挑戰:計算、訪存、通信。本報告將分享 3 個方面的 AI 編譯器設計與優化經驗。計算角度,分享針對定製化加速單元的優化;訪存角度,分享針對 AI 芯片的訪存建模和優化;通信角度,分享計算通信融合的經驗和進展。

觀眾觀看本場分享,你將瞭解:

  1. AI 編譯器優化的全局視角
  2. 瞭解充分發揮 AI 芯片算力的經驗技巧
  3. 瞭解未來分佈式 AI 編譯器發展方向

在這裏插入圖片描述

分享主題: 基於多核架構 NPU 的大模型編譯優化與推理加速實踐

內容簡介:本次分享聚焦於多核架構 NPU 在大模型編譯優化與推理加速中的實踐探索。 通過分析 Transformer 等大模型的計算特性,提出基於 tiling 策略的矩陣優化、數據並行與模型並行的調度機制,以及融合算子與流水線化設計的高效推理方法。結合多核架構的並行特性,優化了算子分解、內存管理,大幅提升推理吞吐量與資源利用率。

觀看本場分享,你將瞭解:

  1. 雲端大模型推理芯片的架構
  2. Transformer 架構下 Attention 超級算子的優化策略

環節 2 圓桌討論

圓桌主題: 芯片-網絡-軟件-算法-生態的協同發展

在這裏插入圖片描述

主辦方及合作伙伴

在這裏插入圖片描述

HyperAI超神經是國內領先的人工智能及高性能計算社區, 旨在通過提供數據集加速下載、在線教程演示、論文深度解讀、頂會日曆集成等多種基礎設施,助力中國的數據科學與⼈⼯智能⾏業的開發者、愛好者學習、理解、實踐,與社區⼀起構建⼈⼯智能的未來。目前超神經官網已經上線數千個經典及優質公開數據集和教程,並運營國內最活躍的 AI 編譯器社區。

訪問官網: https://hyper.ai/

在這裏插入圖片描述

OpenBayes貝式計算是國內領先的高性能計算服務提供商,通過為新一代異構芯片嫁接經典軟件生態及機器學習模型,進而為工業企業及高校科研提供更加快速、易用的數據科學計算產品,其產品已被數十家大型工業場景或頭部科研院所所採用。

訪問官網: https://openbayes.com/

在這裏插入圖片描述

MLC.AI 社區成立於 2022 年 6 月,並由 Apache TVM 主要發明者、機器學習領域著名的青年學者陳天奇,帶領團隊上線了 MLC 線上課程, 系統介紹了機器學習編譯的關鍵元素以及核心概念。

2022 年 11 月,在 MLC.AI 社區志願者的共同努力下,首個完整的 TVM 中文文檔上線,併成功託管至 HyperAI超神經官網,進一步為對機器學習編譯感興趣的國內開發者,提供了接觸並學習一門新技術的基礎設置——文檔。

MLC 線上課程: https://mlc.ai/

TVM 中文文檔: https://tvm.hyper.ai/

在這裏插入圖片描述

上海五角場創新創業學院是楊浦區政府聯合著名高校及行業龍頭企業、創服機構共同發起設立的非營利性教育及服務組織。 以「創造深度連接,讓創新創業更容易成功」為使命,連接創業者和賦能方、提高雙創要素資源的配置效率,促進創造發生。

五角場創院 2022 年 11 月,正式啓用學院公共空間,將 800 平米的空間開放共享給雙創人羣,並聯合港中大上海中心、瑞安集團等夥伴共同發起雙創公益品牌「學院咖啡」,並邀請對雙創公益服務有共識的 KOL、企業和社會組織,成為「公益合夥人」,共同設計不同形式的創業者聚集方式,截止目前「學院咖啡」共舉辦 140+ 場不同形式的雙創主題活動,匯聚 3000+ 位參與者。

活動支持

在這裏插入圖片描述

活動行: 掃碼跳轉至活動行報名

在這裏插入圖片描述

掃碼備註「AI 編譯器」加入活動羣

在這裏插入圖片描述

考慮到本場活動的場地空間情況,我們僅開放了 200 個到場名額,建議大家儘早報名鎖定席位。

12 月 28 日 13:30-17:45,期待與大家在上海相聚!

user avatar chazhoudeqingchun 頭像 felixzzzz 頭像 u_16099302 頭像 f148lhwy 頭像 u_16175472 頭像
5 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.