tag 深度學習

標籤
貢獻335
509
05:25 PM · Oct 25 ,2025

@深度學習 / 博客 RSS 訂閱

mb691327edb400f - 招聘決勝起跑線:AI重構決策級招聘新範式

招聘決勝起跑線:AI重構決策級招聘新範式 HR們正面臨一個隱性危機:招聘已從“流程執行”變成“高風險決策”。候選人數量爆炸、崗位要求細分、業務週期壓縮,可面試仍依賴個人經驗與主觀判斷——一旦選錯人,代價遠非“再招一次”,而是業務延誤、團隊失衡,甚至錯失市場窗口期。全球調研機構Gartner早已預判:2025年,超60%的大型企業將採用AI面試技術。這不是“要不要用”的選擇題

鏈路 , 一對一 , 人工智能 , 深度學習 , 解決方案

收藏 評論

deephub - 從零開始訓練推理模型:GRPO+Unsloth改造Qwen實戰指南

推理型大語言模型現在確實火了。這類模型的特點是會先對問題做充分思考,然後再給出答案,而不是直接回復。 雖然早期訓練推理型 LLM 的方法多半被各家公司當作核心機密,但最近的DeepSeek-R1、DeepSeekMath、Kimi-k1.5 和 DAPO 這些項目都公開了相關流程。 這些方法讓 LLM 在推理過程中生成更長的思維鏈(Chain-of-Thought,CoT)輸出,推理效果因此得到提

llm , 神經網絡 , 教程 , 人工智能 , 深度學習

收藏 評論

星星上的柳樹 - 功耗網路籤核工具大盤點

“功耗/IR/EM 分析是芯片籤核不可或缺的一環。” 隨着製程節點縮減、堆棧 3D-IC 與片上系統(SoC)複雜度提升,芯片設計中功耗送配網絡 (PDN ) 的 IR 壓降、 EM 風險與熱耦合效應成為性能與可靠性籤核的瓶頸。早期忽視這些因素可能導致後段 tape-out 失敗或壽命衰減。為此,業界推出了多款專用於功耗/IR/EM 籤核的工具,幫助設計團隊在流片前完成全片分析、根因定位與閉

資訊 , 教程 , 知識 , 人工智能 , 深度學習

收藏 評論

全棧技術開發者 - 如何理解CNN在CV與NLP領域運用的聯繫與區別?跨領域任務中如何協調卷積核設計、特徵匯聚和序列全局信息提取以提升整體模型性能?

在人工智能研究的發展歷程中,卷積神經網絡(CNN)因其在模式識別與特徵提取中的卓越表現,成為深度學習的重要基礎工具。CNN最初主要面向二維圖像數據,通過卷積核在局部區域提取空間模式,使得網絡能夠自動構建從低級到高級的特徵表示。然而,隨着自然語言處理技術的不斷進步,研究者發現CNN在文本序列建模中同樣具有顯著作用,能夠識別局部詞組模式、捕捉短語語義信息,並在文本分類、情感分析等任務

卷積 , 卷積核 , yyds乾貨盤點 , 人工智能 , 深度學習 , 池化

收藏 評論

數據科學探索者 - 計算機視覺 - Attention機制(附代碼)_51CTO博客

Softmax函數 Softmax函數用於將值變成一個概率分佈(和為1)。 softmax 的核心作用可以概括為三個方面: 1. 把一組實數轉換成概率分佈 softmax 會把任意向量轉成非負且總和為 1 的結果,常用來表示概率。 這樣模型輸出可以被解釋為不同類別的概率。 2. 放大差異

pytorch , 權重 , 人工智能 , 深度學習 , jquery , 前端開發 , 概率分佈

收藏 評論

chris310wtt - 進階學習 PHP 中的二進制和位運算

在實際項目中,經常需要大量依賴 PHP 中的位運算操作。從讀取二進制文件到模擬處理器,這是一項非常有用的知識,而且也非常酷。 PHP 提供了許多工具來支持你處理二進制數據,但需要從一開始就注意:如果你追求極致的底層效率,PHP 並不是最佳選擇。 不過請耐心看下去!本文將展示關於位運算、二進制和十六進制處理的非常有價值的內容,這些在任何語言中都會有用。 原文鏈接

字符串 , php , 人工智能 , 深度學習 , 十進制

收藏 評論

曼孚科技 - 從“聽得清”到“聽得懂”:音頻標註技術的演進

在人工智能的發展圖譜中,讓機器 “聽見” 並解讀世界,始終是一條充滿挑戰卻意義深遠的探索路徑。 早期技術突破集中於一個明確目標 ——“聽得清”,即實現聲音信號向文字符號的高精度轉化。然而,隨着 AI 應用場景的持續拓展與深化,行業對機器 “聽力” 提出了更高階的要求:不僅要精準轉寫語音內容,更要深度理解其背後的內涵。 把握指令意圖、辨識話語情緒、洞悉聲音場景的複雜構成,成為人工智能向高階智能演進的

機器學習 , 算法 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

1艾一刀 - 八年複合增速最快!聯想方案服務穩坐中國IT服務頭把交椅

近日,IDC發佈《中國IT服務市場(2025H1)跟蹤報告》。聯想方案服務以5.72%市場份額繼續位居中國IT服務市場首位,並以22%同比增長率展現出強勁的發展勢頭,八年內保持行業複合增速最快。 今年以來,作為AI服務領航者,聯想中國方案服務業務羣積極響應國家"人工智能+"戰略,並於近期將AI解決方案及服務戰略全新升級為"一擎四艦",以聯想混合式AI優勢集引領行業智

it , 混合式 , 人工智能 , 深度學習

收藏 評論

JavaEdge - AnyLanguageModel:在蘋果平台上統一本地與雲端大語言模型的 API

本文已收錄在Github,關注我,緊跟本系列專欄文章,咱們下篇再續! 🚀 魔都架構師 | 全網30W技術追隨者 🔧 大廠分佈式系統/數據中台實戰專家 🏆 主導交易系統百萬級流量調優 車聯網平台架構 🧠 AIGC應用開發先行者 | 區塊鏈落地實踐者 🌍 以技術驅動創新,我們的征途是改變世界! 👉 實戰乾貨:編程嚴

swift , yyds乾貨盤點 , API , 人工智能 , 深度學習 , 開發者

收藏 評論

卡梅德生物 - TALEN vs CRISPR:在NF-κB基因編輯中,為何TALEN更勝一籌?

基因編輯技術的發展為現代生命科學研究提供了前所未有的工具支持。在眾多編輯技術中,TALEN和CRISPR/Cas9是目前應用最廣泛的兩種系統。儘管CRISPR/Cas9因其設計簡便、成本較低而備受青睞,但在某些特定應用場景中,TALEN仍展現出獨特優勢。本文基於近期發表於《高校化學工程學報》的一項研究,結合學術平台的資料,探討在NF-κB家族基因編輯中,TALEN為何能表現出更高

CRISPR , TALEN , 人工智能 , 深度學習 , 基因編輯

收藏 評論

deephub - ONNX Runtime Python 推理性能優化:8 個低延遲工程實踐

在深度學習落地過程中,有一個常見的誤區:一旦推理速度不達標,大家的第一反應往往是拿着模型開到,比如:做剪枝、搞蒸餾、甚至犧牲精度換小模型。 實際上生產環境中的 Python 推理鏈路隱藏着巨大的“工程紅利”。很多時候你的模型本身並不慢,慢的是低效的數據搬運、混亂的線程爭用以及不合理的 Runtime 默認配置。在不改變模型精度的情況下,僅靠ONNX Runtime (ORT) 的工程特性,往往就能

神經網絡 , 人工智能 , 深度學習 , Python

收藏 評論

wx5827c118a14bb - nest+LangGraph學習路線

🚀 學習路線總覽 目標是讓你能用 Nest(NestJS)作為後端服務框架 + LangGraph(基於 LangChain 的 AI 代理編排框架) 構建可用的智能應用(如智能客服、多步驟任務執行 Agent 等)。 🧱 第一階段:基礎打底 1) JavaScript / TypeScript 基礎 Nest.js 和 LangGraph 都建議用 TypeS

github , API , 持久化 , 人工智能 , 深度學習

收藏 評論

mob64ca1408d5ff - github copilot賬號多客户端

使用過GitHub的小夥伴應該知道需要創建一個自己的倉庫,其創建過程不再贅述。 1、打開Git Bash,輸入命令: git config –global "你的GitHub用户名" 回車 git config –global "你的GitHub郵箱" 回車 git conf

github , 客户端 , 人工智能 , 深度學習 , Git

收藏 評論

deephub - 融合AMD與NVIDIA GPU集羣的MLOps:異構計算環境中的分佈式訓練架構實踐

在深度學習的背景下,NVIDIA的CUDA與AMD的ROCm框架缺乏有效的互操作性,導致基礎設施資源利用率顯著降低。隨着模型規模不斷擴大而預算約束日益嚴格,2-3年更換一次GPU的傳統方式已不具可持續性。但是Pytorch的最近幾次的更新可以有效利用異構計算集羣,實現對所有可用GPU資源的充分調度,不受制於供應商限制。 本文將深入探討如何混合AMD/NVIDIA GPU集羣以支持PyTor

神經網絡 , pytorch , 人工智能 , 分佈式系統 , 深度學習

收藏 評論

deephub - PINN訓練新思路:把初始條件和邊界約束嵌入網絡架構,解決多目標優化難題

PINNs出了名的難訓練。主要原因之一就是這個多目標優化問題。優化器很容易找到投機取巧的路徑——比如拼命降低微分方程殘差,但完全不管初始條件和邊界約束。只要給初始條件和邊界損失配的權重夠低,它們增加的那點損失完全能被殘差損失的大幅下降抵消掉。調整權重也許能暫時緩解這個問題,但誰也不能保證最優權重在整個訓練過程中一直有效。 標準的PINN用複合損失函數,把三項加權求和: 初始條件損失 邊界損失

神經網絡 , pytorch , 人工智能 , 深度學習

收藏 評論

JUGG11 - 硬核解析:AI 原生知識庫系統如何擊穿企業知識管理技術瓶頸

在企業知識管理領域,傳統工具的技術短板早已成為數字化轉型的攔路虎:關鍵詞檢索的 “信息噪聲冗餘”、知識沉澱的 “被動低效困境”、跨系統集成的 “接口壁壘難題”,這些痛點本質上都是架構設計與技術選型的底層缺陷。而一款以 AI 大模型為核心驅動的開源知識庫系統,憑藉直擊核心的技術架構與工程化實現,將知識管理的效率與靈活性提升至新維度。本文將從底層技術架構、核心模塊實現、企業級適配能力

性能優化 , 數據 , 知識管理 , 人工智能 , 深度學習

收藏 評論

超神經HyperAI - 從算力到電力,谷歌/微軟/Meta佈局清潔能源,中國企業背靠國家電網優勢

在美國中西部腹地,愛荷華州連綿起伏的玉米田上,巨大的白色風車不知疲倦地轉動着,地面下新鋪設的輸電線路通向數公里外一座同樣晝夜不休的建築內,這裏不生產鋼鐵、不加工食物,也不製造汽車,卻持續吞噬着巨量電力——因為在服務器機櫃之間,大量高性能 GPU 正在並行運轉。 過去十年,科技公司談論的關鍵詞是「雲、大模型、算力規模」。很少有人真正關心這些詞背後最基礎的問題:電,從哪裏來。但近兩年來,這個問題愈發難

機器學習 , 算法 , 知識 , 人工智能 , 深度學習

收藏 評論

棉花糖 - 學習筆記七:transformer總結(1)

《Transformer最強動畫講解》以“視覺化理論推演+PyTorch工程化落地”的教學範式,讓我實現了從“懂理論”到“通代碼”的進階,更收穫了一套高效的深度學習學習方法。 教程開篇錨定2017年奠基論文《Attention Is All You Need》,直擊傳統序列模型的兩大痛點:RNN及其變體受串行計算限制,長距離依賴捕捉能力弱且並行效率低;CNN雖能

歸一化 , Mask , 人工智能 , 深度學習

收藏 評論

HyperAI超神經 - 2026年將成中美AI競賽拐點?美國監管邏輯轉向背後,各巨頭算力豪賭未止

如果要用關鍵詞概括 2025 年,那麼這一年無可爭議地屬於人工智能:當 AI 發展不再止步於技術圈內部的競賽,而深度滲入內容生產、情感互動和公共討論,那麼它已經成為了塑造世界的真實力量。 人們對 AI 的評價也從未如此分裂。劍橋詞典發佈了 2025 年度詞「Parasocial(準社會關係)」,指出了人們與虛擬對象——包括 AI 聊天機器人——之間愈發普遍的單向情感連接。 「隨着與

插入圖片 , 人工智能 , 基礎設施 , 深度學習

收藏 評論

短短同學 - 對象住哪裏?——深入剖析JVM內存結構與對象分配機制

對象住哪裏?—— 深入剖析 JVM 內存結構與對象分配機制 在 Java 程序運行時,我們創建的每一個對象(如new User())都需要佔用 JVM 內存,但這些對象究竟 “居住” 在哪個內存區域?為何有的對象很快被回收,有的卻能長期存活?要解答這些問題,必須先理清 JVM 的內存結構劃分,再深入對象從創建到銷燬的全生命週期分配邏輯 —— 這不僅是面試高頻考點,更是理解

User , jvm , 人工智能 , 深度學習 , 常量池

收藏 評論

farfarcheng - 邁入大模型時代的深度學習:使用 Flash Attention 技術讓 Transformer 起飛

Transformer 是 ChatGPT 等大語言模型的核心技術之一,而注意力機制是其的關鍵部分。但是,標準的注意力實現具有二次時間和內存複雜度,使其在長序列任務上變慢並消耗大量顯存。這限制了 Transformer 能夠建模的上下文長度,同時使得大尺度模型的訓練和推理時間延長。 FlashAttention: Fast and Memory-Efficient Exact Attention

機器學習 , Flash , 人工智能 , transformer , 深度學習

收藏 評論

憂鬱的吐司 - 數字人帶貨狂攬 23 億!數字人主播成電商新寵,直播帶貨迎來全新時代?

2025 年雙十一,數字人帶貨交出了震撼行業的成績單:京東平台數字人直播總成交額突破 23 億元,1.7 萬商家通過虛擬主播實現 24 小時不間斷開播,帶動平台整體轉化率提升 30%。(青否數字人源頭v:zhibo175) !從凌晨三點仍在滔滔不絕的國貨彩妝虛擬主播,到創下 5500 萬單場 GMV 的羅永浩 AI 分身,數字人正從直播帶貨的 “補充角色” 躍升為 “核心生產力”,引發行業對 “無

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

jkfox - 權重向量是特徵向量嗎 特徵向量與權重的關係

前言 動筆寫這個支持向量機(support vector machine)是費了不少勁和困難的,原因很簡單,一者這個東西本身就並不好懂,要深入學習和研究下去需花費不少時間和精力,二者這個東西也不好講清楚,儘管網上已經有朋友寫得不錯了(見文末參考鏈接),但在描述數學公式的時候還是顯得不夠。得益於同學白石的數學證明,我還是想嘗試寫一下,希望本文在兼

權重向量是特徵向量嗎 , 支持向量機 , 數據 , 人工智能 , 深度學習 , 約束條件

收藏 評論

Lab4AI - NeurIPS 2025Mamba引爆3D重建!MVSMamba:效率與精度雙雙超越Transformer

論文標題:MVSMamba: Multi-View Stereo with State Space Model 作者團隊:北京科技大學 發佈時間:2025年11月4日 👉一鍵直達論文 👉Lab4AI大模型實驗室論文閲讀 ✅Lab4AI平台提供AI導讀和AI翻譯等工具,輔助論文閲讀。 ⭐研究背景 基於學習的多視圖立體視覺方法嚴重依賴魯棒的特徵匹配。傳統CNN方法因感受野有限,難以捕捉全局特徵

llm , 算法 , chatgpt , 人工智能 , 深度學習

收藏 評論