地平線智駕開發者 -
linux 常見穩定性問題分析方法
1.概述
穩定性對項目交付、用户體驗有着非常重要的影響,一般定義的穩定性問題是遇到了系統異常重啓或者系統卡死等,即無法按照預期為客户繼續提供功能和服務。地平線 SoC 平台提供了多種調試手段,去分析系統遇到的穩定性問題。
首先我們需要了解征程系列的軟硬件方案及異常 reset 路徑,通過了解異常路徑定位發生異常的節點和步驟,定位到問題方向。
其次,我們需要對發生問題節點提取的調試信息,包括抓取 l
自動駕駛
,
算法
地平線智駕開發者 -
大模型常見量化方法簡介
一、引言
隨着大型語言模型(LLM)在具身智能等領域的廣泛應用,接下來就該思考如何在有限硬件資源下部署這些模型,量化是其中必不可少的步驟。
模型量化(Model Quantization)作為一種有效的模型壓縮技術,通過將模型中的浮點數參數轉換為低比特寬度的整數表示,顯著減少了模型的存儲和計算需求,同時儘量保持模型的性能。量化的基礎知識相信大家都不會陌生,例如必然要介紹兩種量化方式:PTQ/QAT
自動駕駛
,
算法
地平線智駕開發者 -
大模型 | QWen3 結構解析
一、簡介
25/4/29 發佈的u Qwen3 /u系列模型,共 8 個模型,其中六個u Dense 模型/u分別為,Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B。另外兩個u MoE 模型/u分別為,Qwen3-235B-A22B,擁有 2350 多億總參數和 220 多億激活參數的大模型,以及 Qwen3-30B-A3
自動駕駛
,
算法
地平線智駕開發者 -
LLM 量化技術概述及 AWQ 和 GPTQ 介紹
一、前言
近期在學習 Qwen3 的模型結構時,看到了 Qwen 使用了 GPTQ 與 AWQ 量化方案,於是便萌生了介紹 LLM 量化技術的想法,筆者將用 2-3 篇文章,給讀者們介紹大模型量化的技術。
量化是指將高精度計算的浮點型數據近似為低比特位數據(如 int16、int8、int4 等)的過程,此過程需在不顯著損耗精度的同時,提升模型推理效率並降低內存佔用。特別是在當前主流大語言模型(L
自動駕駛
,
算法
地平線智駕開發者 -
PTQ 量化數值範圍與優化
一、PTQ 模型量化問題
1.1、模型問題
基於公版模型訓練,沒有對模型做範圍做約束,weight\_decay=1e-6, 訓練出的 float 模型數值分佈很大,如圖 2,可以看到模型的後面幾層數據分佈範圍很廣,最大閾值超過了 8000,對我們量化來説並不友好。
1.2、算子問題
如圖 2,基於全 int16 算子配置量化,當前版本 resize 算子有約束(請查閲工具鏈算子支持情況),只能支
自動駕駛
,
算法
地平線智駕開發者 -
征程 6P/H 計算平台部署指南
1.前言
本文旨在提供 征程 6H/P 計算平台的部署指南,將會從硬件、軟件兩部分進行介紹,本文整理了我們推薦的使用流程,和大家可能會用到的一些工具特性,以便於您更好地理解工具鏈。某個工具具體詳 l 細的使用説明,還請參考用户手冊。
2.征程 6H/P 硬件配置
2.1 BPU®Nash
2.2 硬件規格
BPU
DSP
算
自動駕駛
,
算法
地平線智駕開發者 -
開發者 | 2025 智能駕駛開發者系列培訓在京順利召開!
11 月 30 日,由地平線、中國汽車工程學會主辦,聯合中國智能網聯汽車產業創新聯盟打造的 2025 智能駕駛開發者系列培訓在北京圓滿落幕。本次培訓吸引了北京理工大學、吉林大學、長安大學、一汽、廣汽、比亞迪、蔚來汽車、賽力斯、中信科智聯、北斗智聯、億咖通等 60 餘家來自全國高校、科研機構以及整車與零部件企業的廣泛參與。累計參與人數超 400 人,106 位專業學員參與線下實踐,現場氣氛熱
自動駕駛
,
算法
地平線智駕開發者 -
征程 6 | linear 高精度輸出配置方式
1. 常規情況
基礎知識:
考慮到模型輸出位置量化損失對模型精度的影響較大,工具鏈推薦模型以 linear/conv 結尾,此時支持高精度 int32 輸出(在 quantized.onnx 中,轉定點為 int32,在前面 calib+qat 階段都是 float32),這幾乎可以做到無損。
征程 6 工具鏈量化 setter 模板支持自動設置高精度輸出,前提是 conv 輸出直接 接 d
自動駕駛
,
算法
地平線智駕開發者 -
征程 6 | QAT 新版 qconfig 量化模板使用教程
1.前言
隨着 征程 6 芯片家族的陣容不斷壯大,算法工具鏈在量化精度方向的優化也在持續深入,具體體現在兩個方面:
征程 6P 與 征程 6H 工具鏈已陸續進入發佈和試用階段,在此背景下,QAT(量化感知訓練)需要以更高效的方式適配算子的浮點計算能力,以確保量化精度和用户的使用體驗;
MatMul、Conv、Linear 等 Gemm 類算子目前已正式支持雙 int16 輸入,這一改進有助於
自動駕駛
,
算法
地平線智駕開發者 -
LLM 訓練基礎概念與流程簡介
1. LLM 訓練基礎概念
1.1 預訓練(Pretrain)
LLM 首先要學習的並非直接與人交流,而是讓網絡參數中充滿知識的墨水,“墨水” 理論上喝的越飽越好,產生大量的對世界的知識積累。 預訓練就是讓 Model 先埋頭苦學大量基本的知識,例如從 Wiki 百科、新聞、書籍整理大規模的高質量訓練數據。 這個過程是“無監督”的,即人類不需要在過程中做任何“有監督”的校正,而是由模型自己從大量文
自動駕駛
,
算法
地平線智駕開發者 -
Camsys 時間戳信息簡介
不同平台時間戳介紹
1.征程 3 平台
其中 u64 timestamps: 硬件時間戳,是跟 CPU 一起用的 64 bit system counter,1s 是 24M 個 clock。 FS 的時候從硬件寄存器讀取。讀取的值除以 24000 是毫秒,除以 24000000 是秒。
struct timeval tv; 系統時間, SIF FS 的時候獲取 do\_gettimeofday。
自動駕駛
,
算法
地平線智駕開發者 -
征程 6 | 多任務 不同幀率 部署方案
1.方案描述
推理多任務模型時,可能會有不同任務分支 部署不同幀率的需求,例如 BEV 動態任務 20 幀,靜態任務 10 幀這種情況。
最簡單的方式是編譯兩個模型,分開推理:
模型 1:backbone+neck+ 動態 head
模型 2:backbone+neck+ 靜態 head
此時,重複的公共部分 backbone+neck 會重複佔用內存與存儲,且 backbone+
自動駕駛
,
算法
地平線智駕開發者 -
mul 與 reduce_sum 的優化實例
一、基礎介紹
什麼是 mul 與 reduce\_sum?
mul 通常指元素級乘法(Element-wise Multiplication),它將兩個形狀相同的張量中對應位置的元素相乘,返回一個與原張量形狀相同的新張量。
reduce\_sum 是一種規約操作(Reduction Operation),它沿指定維度對張量的元素求和,從而 “壓縮” 或 “減少” 張量的維度。如果不指定維度,則對所
自動駕駛
,
算法