tag 神經網絡

標籤
貢獻52
166
07:19 PM · Oct 26 ,2025

@神經網絡 / 博客 RSS 訂閱

Lab4AI - 7M參數,幹翻巨無霸LLM!這款超小遞歸模型(TRM),在ARC-AGI上證明了“少即是多”

01 論文概述 論文標題:Less is More: Recursive Reasoning with Tiny Networks 作者團隊:三星AI實驗室(Samsung SAIL Montréal) 發佈時間:2025年9月6日 論文鏈接:https://arxiv.org/pdf/2510.04871 👉您可以跳轉到 Lab4AI 平台上去閲讀論文原文。 Lab4AI

機器學習 , 神經網絡 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

mob64ca14133dc6 - 用10行Python代碼,實現AI目標檢測技術!(Python是最好的語言)-

引言 人工智能(AI)——一個熟悉又神秘的詞彙。我們常聽説它可以生成詩歌、編寫代碼、創作藝術,甚至回答各種問題。然而,當你想親手實現一個“AI模型”時,卻可能感到無從下手。這篇教程正是為你準備的,將帶你從零開始,逐步掌握從“AI新手”到“能夠搭建AI模型”的核心技能。 一、AI的基本概念 1.什麼是AI模型? AI模型是通過訓練得到的一種程序,能夠利用海量

數據 , 神經網絡 , 深度學習 , Css , 前端開發 , HTML

收藏 評論

deephub - Scikit-Learn 1.8引入 Array API,支持 PyTorch 與 CuPy 張量的原生 GPU 加速

Scikit-Learn 1.8.0 更新引入了實驗性的 Array API 支持。這意味着 CuPy 數組或 PyTorch 張量現在可以直接在 Scikit-Learn 的部分組件中直接使用了,且計算過程能保留在 GPU 上。 1.8.0 到底更新了什麼? Scikit-Learn 開始正式支持Python Array API 標準。這是一個由 NumPy、CuPy、PyTorch、J

神經網絡 , pytorch , 人工智能 , 深度學習 , sklearn-pandas

收藏 評論

華明視訊科技 - 鐵路貨車自動識別系統:推動貨運智能化升級

鐵路貨運作為國家經濟動脈的重要組成部分,其運行效率與管理水平直接影響物流體系的整體效能。傳統依賴人工抄錄車號信息的作業方式,不僅效率低下,還容易因人為因素導致數據錯漏,已難以適應現代智慧物流的發展需求。在此背景下,鐵路貨車自動識別系統應運而生,成為行業數字化轉型的重要引擎。 該系統基於人工智能深度學習技術,實現了對貨運列車車廂多維度信息的自動採集與識別。可高效識別敞車、平車、棚車、罐車等不同

數據挖掘 , 圖像識別 , 神經網絡 , 人工智能 , 深度學習

收藏 評論

高光視點 - 華興資本王力行:預見AI,從技術創新走向產業變革——基礎共識之上的非共識

在2025科創大會11月27日的「人工智能創新項目“掘金匯”」論壇上,華興資本集團首席執行官王力行發表主題演講《預見AI:從技術創新到產業變革——基礎共識之上的非共識》圍繞技術演進、應用趨勢與生態力量,分享了他對當前AI發展階段的系統性觀察。他指出,行業對“AI推動生產力躍遷”已形成基礎共識,但在路徑選擇、落地節奏與商業模式上仍存在大量非共識,而真正的機會,往往孕育在這些非共識的

神經網絡 , AI發展 , 人工智能

收藏 評論

deephub - 從零開始訓練推理模型:GRPO+Unsloth改造Qwen實戰指南

推理型大語言模型現在確實火了。這類模型的特點是會先對問題做充分思考,然後再給出答案,而不是直接回復。 雖然早期訓練推理型 LLM 的方法多半被各家公司當作核心機密,但最近的DeepSeek-R1、DeepSeekMath、Kimi-k1.5 和 DAPO 這些項目都公開了相關流程。 這些方法讓 LLM 在推理過程中生成更長的思維鏈(Chain-of-Thought,CoT)輸出,推理效果因此得到提

llm , 神經網絡 , 教程 , 人工智能 , 深度學習

收藏 評論

數據探索者 - Transformer入門教程(二)模型設計(一)_transformer開發

本文詳細介紹瞭如何利用JAX及其神經網絡庫Haiku,從零開始構建並訓練一個完整的Transformer模型。內容涵蓋自注意力機制、線性層、歸一化層、嵌入層的實現,以及如何結合Optax優化器構建訓練循環,為理解和使用JAX進行深度學習開發提供了實用指南。 使用JAX從零構建Transformer模型全流程解析 在本教程中,我們將探討如何使用JAX開發神經網絡。而Tr

歸一化 , 神經網絡 , 損失函數 , 後端開發 , Python

收藏 評論

deephub - ONNX Runtime Python 推理性能優化:8 個低延遲工程實踐

在深度學習落地過程中,有一個常見的誤區:一旦推理速度不達標,大家的第一反應往往是拿着模型開到,比如:做剪枝、搞蒸餾、甚至犧牲精度換小模型。 實際上生產環境中的 Python 推理鏈路隱藏着巨大的“工程紅利”。很多時候你的模型本身並不慢,慢的是低效的數據搬運、混亂的線程爭用以及不合理的 Runtime 默認配置。在不改變模型精度的情況下,僅靠ONNX Runtime (ORT) 的工程特性,往往就能

神經網絡 , 人工智能 , 深度學習 , Python

收藏 評論

deephub - 融合AMD與NVIDIA GPU集羣的MLOps:異構計算環境中的分佈式訓練架構實踐

在深度學習的背景下,NVIDIA的CUDA與AMD的ROCm框架缺乏有效的互操作性,導致基礎設施資源利用率顯著降低。隨着模型規模不斷擴大而預算約束日益嚴格,2-3年更換一次GPU的傳統方式已不具可持續性。但是Pytorch的最近幾次的更新可以有效利用異構計算集羣,實現對所有可用GPU資源的充分調度,不受制於供應商限制。 本文將深入探討如何混合AMD/NVIDIA GPU集羣以支持PyTor

神經網絡 , pytorch , 人工智能 , 分佈式系統 , 深度學習

收藏 評論

deephub - PINN訓練新思路:把初始條件和邊界約束嵌入網絡架構,解決多目標優化難題

PINNs出了名的難訓練。主要原因之一就是這個多目標優化問題。優化器很容易找到投機取巧的路徑——比如拼命降低微分方程殘差,但完全不管初始條件和邊界約束。只要給初始條件和邊界損失配的權重夠低,它們增加的那點損失完全能被殘差損失的大幅下降抵消掉。調整權重也許能暫時緩解這個問題,但誰也不能保證最優權重在整個訓練過程中一直有效。 標準的PINN用複合損失函數,把三項加權求和: 初始條件損失 邊界損失

神經網絡 , pytorch , 人工智能 , 深度學習

收藏 評論

數據解碼者 - 【深度學習實戰02】——VGG網絡提取輸入圖像的特徵並顯示特徵圖_輸入圖像,從圖像中學習特徵,輸出圖像

深度學習的效果越來越好,在一些方面甚至超過了人類水平,為了更好地理解神經網絡如何識別特定模式的圖像,以及為什麼識別結果可以如此準確,需要從更深層次,即識別過程去了解神經網絡.一旦瞭解了識別過程,我們就可以對神經網絡做進一步的改進,另一方面也有助於人類理解機器作出決策的過程及原因,這一點在智能醫療中顯得尤為重要. 特徵圖的顯著激活 一旦神經網絡中的某個特徵圖

數據集 , 神經網絡 , 深度神經網絡 , 人工智能

收藏 評論

華明視訊科技 - 岸橋自動理貨系統:AI視覺技術重塑港口智能作業新標準

在現代化港口運營中,效率、安全與準確性是理貨業務的核心挑戰。岸橋自動理貨系統應運而生,通過融合人工智能、邊緣計算與高清視覺技術,實現對集裝箱信息的實時感知、識別與處理,推動港口作業進入全面智能化時代。 系統核心架構與技術優勢 本系統以高性能高清攝像機和嵌入式AI工控機為核心硬件,依託邊緣計算架構,將算法部署在作業最前端。系統通過在岸橋上直接進行視覺採集與實時分析,有效避免了傳統視頻傳輸

數據挖掘 , 圖像識別 , 神經網絡 , 人工智能 , 深度學習

收藏 評論

編程夢想家 - 實時實例分割最新

本文主要解決視頻目標分割領域的一個基本問題:如何使分割模型能夠有效地適應特定視頻以及在線目標的外觀變化。 解決辦法:提出一個圖存儲網絡來對分割模型進行“學習更新”。 大概流程分為兩步:首先構建一個由全連接圖構成的情景存儲網絡,將幀存儲為節點,並通過邊捕獲跨幀的相關性。然後,可學習的控制器被嵌入以簡化內存的讀寫。 相比於以往模型的優勢:結構化的外部

機器學習 , 實時實例分割最新 , 神經網絡 , 人工智能 , 深度學習 , 計算機視覺

收藏 評論

min2k - 一天一個Python庫:Pandas - 拿捏數據的N種姿勢

引言 歡迎來到【一天一個Python庫】系列!在上一篇中我們介紹了數據可視化的畫筆 Matplotlib, 今天我們要認識的是 Python 數據處理與分析領域的靈魂工具 — Pandas。 如果説 NumPy 負責“算數據”,那麼 Pandas 就是負責“處理和分析數據”。 一、什麼是 Pandas? Pandas 是 Python 中最流行

數據 , 神經網絡 , 人工智能 , pandas , Python

收藏 評論

deephub - 別再往一個智能體裏塞功能了:6種多智能體模式技術解析與選型指南

一個 AI 智能體在簡單任務上跑得很順,加了幾個功能之後突然開始胡説八道、忽略指令、選錯工具、丟失上下文。這就是所謂的"單體智能體牆":單個智能體從可用變成不可用的臨界點。 Anthropic 的研究數據表示當智能體掛載超過 10-15 個工具後性能就會斷崖式下跌。但企業級系統動輒需要上百個功能接口就不可能用單體架構撐住。 而且很多開發者還會堆智能體,當第一個智能體有問題的時候就往上加第二

llm , agent , 神經網絡 , 人工智能 , 深度學習

收藏 評論

deephub - Google Code Wiki:GitHub代碼庫秒變可交互文檔

Google發佈的這個Code Wiki項目可以在代碼倉庫之上構建動態知識層的工具,或者説可以"自動生成文檔"。 第一層是結構解析:Code Wiki使用Tree-sitter對代碼進行語法樹分析,將源碼拆解成類、函數、方法、導入語句和依賴項。Tree-sitter是一個增量解析庫支持多種編程語言,能夠生成抽象語法樹(AST)。這比純文本處理要精確得多,因為系統真正"看懂"了代碼的語法結構

llm , 神經網絡 , 人工智能

收藏 評論

華明視訊科技 - 想知道海關智能卡口系統廠家靠不靠譜,記住以下五點,絕對不踩坑!

各位關心口岸智能化建設的同仁們,大家好!我是華明視訊。我們深耕海關智能監管領域多年,見證了太多企業在選擇卡口系統時踩坑、交學費。一套不靠譜的系統,輕則導致通關效率低下,重則引發監管風險,損失難以估量。 今天,我們不吹噓自己,只想作為行業裏的“老炮兒”,給大家分享五個硬核的評判標準。想知道一個海關智能卡口系統廠家靠不靠譜,照着這五點去問、去看,心裏立馬就有底! 第一點:看“身份證”與“履

圖像識別 , 神經網絡 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

編程夢想家 - (八)神經網絡-線性層及其他層介紹_神經網絡線性層

20.1打開pytorch官網 1.打開torch.nn-Normalization Layers 找到BatchNorm2d: 點擊查看代碼 class torch.nn.BatchNorm2d(num_features, eps=1e-05, momentum=0.1, affine=True, track_running_stat

數據 , 神經網絡 , Css , 2d , 前端開發 , HTML

收藏 評論

華明視訊科技 - 智能卡口系統解決方案:構築現代化海關監管的智慧防線

隨着全球貿易的飛速發展,海關卡口作為貨物進出口的關鍵節點,其監管效率與準確性直接關係到國門安全與通關流速。傳統依賴人工查驗的模式已難以應對日益增長的流量與複雜的監管需求。為此,我們推出全新的智能卡口系統解決方案,通過深度融合物聯網、自動識別與數據智能技術,實現卡口監管的無人化、自動化與智能化,為構建智慧海關提供堅實的技術底座。 智能卡口系統解決方案核心:全流程無人化智能監管 本方案旨在

機器學習 , 圖像識別 , 神經網絡 , 人工智能 , 深度學習

收藏 評論

編程之翼 - tensorflow的主要用途

本章簡單介紹了TensorFlow的安裝以及使用。一些細節需要在後續的應用中慢慢把握。 TensorFlow並不僅僅侷限於神經網絡和機器學習,它甚至可以用於量子物理仿真。 TensorFlow的優勢: 可運行於諸多操作系統 提供一個叫做TF.Learn(tensorflow.contrib.learn)的簡單的Python API,和Sciki

機器學習 , tensorflow , 神經網絡 , API , 人工智能 , tensorflow的主要用途

收藏 評論

deephub - 氛圍編程陷阱:為什麼AI生成代碼正在製造大量"偽開發者"

這是一篇再國外討論非常火的帖子,我覺得不錯所以把它翻譯成了中文。 大語言模型和ai只能提的發展衍生出了一個東西叫"vibe coding"(氛圍編程)——用自然語言描述需求,讓AI生成代碼,看起來不用寫代碼就能做出產品。 但這玩意兒本質上是個陷阱。它培養的不是開發者,而是一羣只會生成代碼、卻看不懂也改不了代碼的"中間商"。 對新手來説,這不是什麼職業捷徑。這是條斷頭路,而且很多人正往裏衝。 氛圍編

觀點 , llm , 神經網絡 , 人工智能 , 深度學習

收藏 評論

deephub - Scikit-image 實戰指南:10 個讓 CV 模型更穩健的預處理技巧

在計算機視覺工程落地中我們常遇到一種現象:模型在驗證集上表現完美,但是一旦部署到生產環境準確率卻莫名下跌。這種“性能衰退”往往不源於模型架構本身而是歸咎於預處理管道的脆弱性。數據類型的隱式轉換、縮放算法的細微差異、或是未被矯正的幾何形變,這些看似微不足道的工程細節往往是系統失效的根源。 相比於盲目調整超參數,建立一套確定性強的預處理流程性價比更高。本文總結了基於 scikit-image 的十個工

圖像識別 , 神經網絡 , 人工智能 , 深度學習

收藏 評論

步步為瑩 - 不用懂數學!Python+Keras 快速搭建第一個神經網絡

引言 神經網絡是人工智能和深度學習的核心技術之一,它模擬了人腦的工作方式,通過大量的訓練數據和計算來解決複雜的任務,如圖像分類、語音識別、自然語言處理等。今天,我們將帶你快速搭建一個簡單的神經網絡,使用 Python 和 Keras 庫,完全不需要理解複雜的數學公式和推導。只要跟着步驟走,你就能順利完成自己的第一個神經網絡! 什麼是 Keras? Keras 是

數據 , 神經網絡 , 激活函數 , 後端開發 , Python

收藏 評論

mob64ca1405d568 - HAO 人 物體 動作預測 計算機視覺任務

作者|VVingerfly 3D人體姿態和形狀估計在最近幾年是一個重要的研究熱點,但大部分工作僅僅關注人體部分,忽略了手部動作,港中文聯合Facebook AI研究院提出了一種從單張圖片同時估計人體姿態和手部動作的新方法,展示效果好似科學怪物。 如下圖左下和右下所示,易看出本文提出的方法姿態估計效果更好。

機器學習 , 神經網絡 , 人工智能 , 深度學習 , 計算機視覺

收藏 評論