在持續演進的 AI 編譯器技術浪潮中,越來越多的探索正在發生、沉澱與交匯。12 月 27 日,Meet AI Compiler 第八期正是在這樣的背景下與大家如期相見。 本期活動,我們邀請了來自上海創智學院、TileAI 社區、華為海思、先進編譯實驗室、AI9Stars 的 5 位專家,帶來了覆蓋軟件棧設計、算子開發到性能優化的全鏈路分享。講師們結合各自團隊的長期探索,展示了不同技術路線在真實場
vLLM 是一款專為大語言模型推理加速而設計的框架,實現了KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →vllm.hyper.ai/ *在線運行 vLLM 入門教程:零基礎分步指南 源碼examples/offline_inference/rlhf.py # SPDX-License-Identifier: Apache-2.0 """ 一個基於 v
在大模型可以從互聯網、圖像庫和海量文本中「無限生長」的今天,機器人卻被困在另一個世界——真實世界的數據極度稀缺、昂貴且不可複用。 Business Insider 曾發佈過一則看似輕巧卻又極具洞察力的報道,「AI 機器人面臨數據荒,一家初創公司找到了出人意料的解決方案」。 報道指出,相比語言和視覺模型幾乎取之不盡的訓練語料,機器人與現實世界交互所需的數據在規模、結構化程度和可遷移性上都遠遠不足,這
Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →triton.hyper.ai/ triton.language.advance(base, offsets) 推進 1 個塊指針。 參數: base- 要推進的塊指針。 off
TVM 現已更新到 0.21.0 版本,TVM 中文文檔已經和新版本對齊。 Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →Apache TVM TVM 支持多種編程語言用於編譯器棧的開發和部署。在本説明中,我們將解釋 TVM 運行時的關鍵組成部分。 VM 的運行時系統需要滿足多種看似相互矛盾但又非常關鍵的需求:
天氣預報的精準度和預見期,直接影響災害防禦、農業生產和全球資源調度。從短時預警到季節乃至更長期的氣候預測,每延長一步,技術挑戰都成倍增加。傳統數值預報發展多年後,AI 為這一領域帶來了新動力。近年來,AI 天氣預報模型已在中期預報上取得突破,其性能媲美甚至超越了先進的傳統動力模式。 目前主流 AI 氣象模型多采用自迴歸架構,其原理是逐步推演,通過學習歷史數據中的短期大氣變化規律,預測未來幾小時的狀
在美國中西部腹地,愛荷華州連綿起伏的玉米田上,巨大的白色風車不知疲倦地轉動着,地面下新鋪設的輸電線路通向數公里外一座同樣晝夜不休的建築內,這裏不生產鋼鐵、不加工食物,也不製造汽車,卻持續吞噬着巨量電力——因為在服務器機櫃之間,大量高性能 GPU 正在並行運轉。 過去十年,科技公司談論的關鍵詞是「雲、大模型、算力規模」。很少有人真正關心這些詞背後最基礎的問題:電,從哪裏來。但近兩年來,這個問題愈發難
vLLM 是一款專為大語言模型推理加速而設計的框架,實現了 KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ *在線運行 vLLM 入門教程:零基礎分步指南 源碼 examples/offline_inference/reproduciblity.py # SPDX-License-Identifier: Ap
Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN計算內核,並能夠在現代 GPU硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →triton.hyper.ai/ triton.language.make_block_ptr(base: tensor, shape, strides, offsets, block_s
本文檔適用於想要了解 TVM 架構或積極開發項目的開發者。本文檔組織結構如下: 整體編譯流程示例:概述 TVM 如何將一個高級模型描述轉換為可部署模塊的各個步驟。建議首先閲讀本節以瞭解基礎流程。 簡要介紹 TVM 棧中的關鍵組件。您也可以參考TensorIR 深度解析和Relax 深度解析,瞭解 TVM 棧中兩個核心部分的詳細內容。 本指南提供了架構的一些補充視圖。首先研
「明年我們去法國接甲骨文回家」,2024 年 12 月下旬,安陽師範學院甲骨文信息處理教育部重點實驗室的研究人員遠赴法國,與法國國家圖書館等 4 家甲骨文收藏機構簽訂合作協議,將以數字化形態將已經遠離故土許久的甲骨文文化遺產「接回家」。 2024 年 8 月 5 日,「全球甲骨數字迴歸計劃」正式啓程,實驗室主任劉永革帶領團隊成員張展、李邦、郭安、龔慕凡飛往韓國,於 8 月 13 日帶回了 7 片甲
Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ triton.language.expand_dims(input, axis) 通過插入新的長度為 1 的維度來擴展張量的形狀。 軸
細胞治療產品 (CTP) 作為先進治療藥物 (ATMPs) 的重要組成部分,正為罕見病和疑難雜症患者帶來希望。然而,其生產過程極易受到微生物的侵擾,微生物污染始終如陰霾般籠罩着這束希望之光。傳統的無菌檢測方法,如沿用半個世紀的 USP 71(美國藥典第 71 章記錄的無菌檢測法),在面對精準醫療的新需求時顯得力不從心:長達兩週的培養週期、繁瑣的預處理步驟、依賴主觀判斷的渾濁度觀察,不僅嚴重滯後於細
vLLM 是一款專為大語言模型推理加速而設計的框架,實現了 KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ *在線運行 vLLM 入門教程:零基礎分步指南 源碼examples/offline_inference/mistral-small.py # SPDX-License-Identifier: Apac
「我以為我只有 10% 的機會獲得諾貝爾化學獎」,得知獲獎消息後,John Jumper 在電話採訪中笑着説道。他的語氣中帶着謙遜與感慨,而這份殊榮的背後,則是 AlphaFold2 帶來的科學革命,徹底改變了蛋白質結構預測的方式。 截至目前,已有來自 190 個國家的 200 多萬人使用這一工具,它不僅加速了新藥研發和疾病研究,也為基礎科學探索提供了前所未有的支持,深刻影響了生命科學的未來發展。
今年 6 月,蘋果在 WWDC 上正式推出 Apple Intelligence。消息發佈次日,蘋果股價在盤中突破 200 美元大關,創 2022 年 11 月 10 日以來最大漲幅,截至收盤,蘋果總市值升至 3.18 萬億美元(約合人民幣 23 萬億)。 從某種程度上來看,Apple Intelligence 的亮相令市場對蘋果重拾信心。有分析人士指出,在 AI 的加持下,這一輪暴漲或許是市場對
Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ triton.language.broadcast_to(input, *shape) 嘗試將給定的張量廣播到新的shape。 參數:
vLLM 是一款專為大語言模型推理加速而設計的框架,實現了 KV 緩存內存幾乎零浪費,解決了內存管理瓶頸問題。 更多 vLLM 中文文檔及教程可訪問 →https://vllm.hyper.ai/ vLLM 是一個快速且易於使用的庫,專為大型語言模型 (LLM) 的推理和部署而設計。 vLLM 的核心特性包括: 最先進的服務吞吐量 使用 PagedAttention 高效管理注意力鍵和值的內
次季節至季節(Subseasonal-to-seasonal, S2S)尺度天氣預報介於短期天氣預報與長期氣候預測之間,聚焦未來 2 周至 6 周的天氣演變,精準填補了中遠期氣象預測空白,為農業規劃、災害防禦等提供關鍵依據。但 S2S 天氣預測既難依託快速衰減的大氣初始信息(中短期預報條件),又難捕捉尚未充分顯現的慢變邊界信號(氣候預測條件),在混沌的大氣系統與複雜的海陸氣相互作用下,預報難度顯著
美國東部時間 10 月 28 日下午 12:00,英偉達 CEO 黃仁勳在華盛頓舉行的 GTC 大會上發表主題演講。這是繼今年 3 月聖何塞主會後的又一場區域性 GTC,地點首次來到美國政治中心華盛頓, 會議包含 70 多場,涵蓋 Agentic AI、機器人技術、量子計算和 AI 原生電信(AI-native telecom networks)等議題,一度被外界視為英偉達從「AI 領域引領者」向
TVM 先已更新到 0.21.0 版本,TVM 中文文檔已經和新版本對齊。 Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →Apache TVM Apache TVM 的一個主要設計目標是便於自定義優化流程,無論是用於科研探索還是工程開發,都可以靈活迭代優化過程。本教程將涵蓋以下內容: 目錄 審查整體流程 可
Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ triton.language.join(a, b) 在 1 個新的次要維度中連接給定的張量。 For example, given
在現代科學研究中,高性能計算(HPC)已成為推動重大突破的核心引擎,其以遠超常規計算機的算力,為科學家提供了探索未知世界的「放大鏡」和「加速器」。從模擬宇宙演化、預測氣候變化,到揭示生命分子的運作機制、加速新藥研發,HPC 正不斷拓展人類認知的邊界。 尤其在數據爆炸與人工智能快速發展的時代,AI for Science 發展提速,在很多科研領域,AI 仍存在精度不足、泛化能力弱、通用性不強等問題,
Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →https://tvm.hyper.ai/ 摘要 對於任何支持的 runtime,TVM 都應該輸出正確的數字結果。因此,在編寫驗證數字輸出的單元測試時,這些單元測試應該在所有支持的 runtime 上都能正常運行。由於這是一個非常常見的用例,TVM 的輔助函數可以對