tag 硬件加速

標籤
貢獻4
19
01:18 AM · Nov 21 ,2025

@硬件加速 / 博客 RSS 訂閱

Datenlord - 從循環到融合:理解 Fused MoE 算子原理(一)

引言 在當今大語言模型(LLM)的浪潮中,模型規模的持續擴張是提升性能的關鍵驅動力。然而,隨着模型參數量的激增,訓練和推理的計算成本也隨之飆升。為了解決這一挑戰,混合專家模型(Mixture-of-Experts, MoE)架構應運而生,並已成為許多前沿模型(如 Mixtral 8x7B, DeepSeek-V3)的核心技術之一。 MoE 的核心思想非常巧妙:它不再要求模型的每一部分處理所有的輸入

大數據 , 硬件加速 , 硬件

收藏 評論

Datenlord - 開源Bluespec bsc編譯器和可重用示例設計

這篇介紹Bluespec以及設計示例的文章,是在2021年ICCAD(International Conference On Computer-Aided Design)發佈的論文。達坦科技的open-rdma項目和推廣的MIT體系結構學習社區都用到Bluespec,因此將此論文翻譯成中文,以便大家瞭解2020年Bluespec開源後相關的開源項目。 摘要:bsc編譯器是一個商業可用的編譯器,在過

開源硬件 , 硬件加速 , 開源 , 編譯器 , 硬件

收藏 評論

編程夢想實現家 - 語音識別的基本原理是什麼,語音識別流程分為哪幾步?_語音識別的過程是什麼?語音識別的方法有哪幾種?

語音識別的信號處理流程涉及從原始聲波到可識別文本的轉換,其軟硬件分工明確,協同完成降噪、特徵提取、模型推理等任務。以下是詳細的信號處理流程及軟硬件職責劃分: 一、語音識別信號處理流程 1. 信號採集與預處理 步驟: 麥克風拾音:通過麥克風陣列(如6-8通道)採集環境聲音,轉換為模擬電信號。 模數

信號處理 , 硬件加速 , 人工智能 , Css , 前端開發 , 語音識別 , HTML

收藏 評論

mob64ca140d2323 - 前端- WebGL淺入淺出 - 個人文章

uPlot WebGL實驗:探索高性能可視化的未來方向 在數據可視化領域,隨着實時數據流和大規模數據集的普及,傳統Canvas 2D渲染技術面臨着嚴峻的性能挑戰。當數據點超過10萬甚至達到百萬級別時,幀率下降、交互卡頓等問題成為用户體驗的主要瓶頸。uPlot作為一款輕量級高性能圖表庫,正在通過WebGL實驗探索下一代可視化技術的可能

數據 , 硬件加速 , webgl , jquery , 前端開發

收藏 評論

華山劍宗風清揚 - chrome 標籤切換出現殘影:從瀏覽器繪製原理到系統級排障的全景指南

最近工作遇到一個問題: 從 tab 1 切到 tab 2 時,tab 1 的部分界面被疊加到了 tab 2 上,過幾秒才消失。這類問題表面看像是瀏覽器卡頓,其根因卻可能出現在三層不同的系統裏:應用層 Chrome 的渲染管線、操作系統的桌面合成與顯示疊加路徑、以及顯示設備本身的臨時殘影。弄清楚像素是怎樣從網頁一路流到屏幕,才能對症下藥。 下文分三塊來講:Chrome 如何把像素畫

軟件研發 , chrome , windows , 私藏項目實操分享 , 硬件加速

收藏 評論