神經網絡

標籤

貢獻52

566

07:19 PM · Oct 26 ,2025

@deephub

暱稱deephub

Last seen
@yuhaibao324

暱稱DeepSeaAI

Last seen
@huamingshixunkeji

暱稱華明視訊科技

Last seen
@lab4ai

暱稱Lab4AI

Last seen
@u_16099169

暱稱編程夢想家

Last seen
@lanyiyun666

暱稱藍易雲

Last seen
@u_13303

暱稱colddawn

Last seen
@u_16213590

暱稱mob64ca13f9e726

Last seen
@u_16099165

暱稱編程小達人

Last seen
@u_16099269

暱稱落筆成詩

Last seen
@u_12855

暱稱西門吹雪

Last seen
@u_15903730

暱稱WangLanguager

Last seen

@神經網絡 / 博客 RSS 訂閱

Dec 17 2025

數據探索者 - Transformer入門教程（二）模型設計(一)_transformer開發

本文詳細介紹瞭如何利用JAX及其神經網絡庫Haiku，從零開始構建並訓練一個完整的Transformer模型。內容涵蓋自注意力機制、線性層、歸一化層、嵌入層的實現，以及如何結合Optax優化器構建訓練循環，為理解和使用JAX進行深度學習開發提供了實用指南。使用JAX從零構建Transformer模型全流程解析在本教程中，我們將探討如何使用JAX開發神經網絡。而Tr

歸一化 , 神經網絡 , 損失函數 , 後端開發 , Python

神經網絡

@神經網絡 / 博客 RSS 訂閱

數據探索者 - Transformer入門教程（二）模型設計(一)_transformer開發

deephub - ONNX Runtime Python 推理性能優化：8 個低延遲工程實踐

deephub - 融合AMD與NVIDIA GPU集羣的MLOps：異構計算環境中的分佈式訓練架構實踐

deephub - PINN訓練新思路：把初始條件和邊界約束嵌入網絡架構，解決多目標優化難題

mob64ca1405d568 - HAO 人 物體 動作預測 計算機視覺任務

deephub - Neural ODE原理與PyTorch實現：深度學習模型的自適應深度調節

deephub - 從貝葉斯視角解讀Transformer的內部幾何：mHC的流形約束與大模型訓練穩定性

mob64ca13f9e726 -

華明視訊科技 - 2025年國內口碑不錯的智能閘口系統廠家推薦

deephub - Orion-MSP：深度學習終於在表格數據上超越了XGBoost

deephub - 提升迴歸模型可信度：4種神經網絡不確定性估計方法對比與代碼實現

華明視訊科技 - 鐵路車號識別裝置：賦能鐵路貨運智能化的核心

deephub - vLLM 性能優化實戰：批處理、量化與緩存配置方案

deephub - 如果你的PyTorch優化器效果欠佳,試試這4種深度學習中的高級優化技術吧

deephub - Mosaic：面向超長序列的多GPU注意力分片方案

autohost - 擴散模型Diffusion Models_擴散模型 強化學習

mob64ca14154457 - 乾貨分享 | 深度學習零基礎進階第二彈 -

DeepSeaAI - ChatGLM3微調實戰：基於LLaMA-Factory微調改造企業級知識庫

min2k - 一天一個Python庫：Pandas - 拿捏數據的N種姿勢

華明視訊科技 - 想知道海關智能卡口系統廠家靠不靠譜，記住以下五點，絕對不踩坑！

deephub - Google Code Wiki：GitHub代碼庫秒變可交互文檔

deephub - 別再往一個智能體裏塞功能了：6種多智能體模式技術解析與選型指南

編程夢想家 - （八）神經網絡-線性層及其他層介紹_神經網絡線性層

編程夢想家 - 實時實例分割最新

mob64ca1405d568 - HAO 人物體動作預測計算機視覺任務

autohost - 擴散模型Diffusion Models_擴散模型強化學習