tag 深度學習

標籤
貢獻335
492
05:25 PM · Oct 25 ,2025

@深度學習 / 博客 RSS 訂閱

墨香四溢 - LSTM怎麼動態調整權重

最近看了黃老師的視頻課,一下子覺得自己對這些內容又生疏了,於是找來看了看。現在記錄一下 一、框架 框架的選擇上,我看老黃選擇的也是這張圖,正好作者有點料,於是直接將鏈接添加鏈接描述附上。 這裏有個點,這裏的圖很重要。注意,LSTM的輸出中,每個字輸出為label的概率。 二、LSTM的參數量 參數量計算 LSTM的官方文檔 LSTM的結構圖

歸一化 , 算法 , 重置 , LSTM怎麼動態調整權重 , 人工智能 , 維特比算法 , 深度學習

收藏 評論

baihai - “推理能力”的提升本質上是模型智能的提升嗎?

編者按: 推理模型的“推理能力”飛躍,究竟是模型本身的進步,還是工程編排的巧妙包裝? 我們今天為大家帶來的這篇文章提出了一個尖鋭的觀點:所謂“推理模型”的突破,本質上並非模型智能的根本性提升,而是通過工具調用與流程編排對模型能力停滯所做的工程性補償。 文章深入剖析了 GPT-5 等最新模型在執行任務時嚴重依賴 Python 沙箱、API 調用等外部工具的

llm , AI , 人工智能 , 深度學習

收藏 評論

deephub - llama.cpp Server 引入路由模式:多模型熱切換與進程隔離機制詳解

llama.cpp server在 2025年12月11日發佈的版本中正式引入了 router mode(路由模式),如果你習慣了 Ollama 那種處理多模型的方式,那這次 llama.cpp 的更新基本就是對標這個功能去的,而且它在架構上更進了一步。 路由模式的核心機制 簡單來説,router mode 就是一個內嵌在 llama.cpp 裏的模型管理器。 以前跑 server,啓動時需要指

llm , 人工智能 , 深度學習 , llama , Python

收藏 評論

AI代碼猴 - 技術+服務雙維度評估:2025年GEO優化公司選擇全景指南

權威數據顯示,全球生成式AI搜索流量佔比已突破30%,中國企業部署GEO策略的意願高漲。然而,行業調研揭示核心矛盾:超六成企業因選型不當,導致AI引用率遠低預期。GEO競爭已從單點策略升維至 “技術棧深度”與“服務能力韌性” 的體系化較量。 一、 評估標尺:技術自主性與服務協同度 選擇GEO服務商是為品牌在AI認知層構築資產的戰略決策。技術是地基,決定效果上限;服務是橋樑,保障效果下限。兩者缺一不

數據挖掘 , 人工智能 , 深度學習

收藏 評論

mob64ca1410eb61 - 歐拉角計算深度學習

1. 什麼是歐拉角? 2. 萬向鎖是一種什麼現象? 3. 遊戲動畫中遇到萬向鎖時會發生什麼? 4. 怎樣解決萬向鎖這個問題? 一,什麼是歐拉角? 用一句話説,歐拉角就是物體繞座標系三個座標軸(x,y,z軸)的旋轉角度。 在這裏,座標系可以是世界座標系,也可以是物體座標系,旋轉順序也是任意的,可以是xyz,xzy

關鍵幀 , 旋轉角度 , 歐拉角計算深度學習 , 人工智能 , 深度學習 , 插值

收藏 評論

ceshiren2022 - 如何在技術面試中自信應對“大模型微調”話題?

從事測試開發同學這兩年跳槽,會越來越頻繁遇到“大模型微調”類問題。很多人第一反應是:我平時寫 UI 自動化、搞接口壓測,怎麼突然和模型訓練扯上關係了? 現實就是,AI 已經透進測試領域:質量評估、數據生成、智能測試、甚至大模型測試本身,都需要對微調機制、預訓練邏輯、指令數據構造有基本理解。 下面整理了一份涵蓋 35 個經典微調面試問題的技術解讀幫助你在面試裏不被問懵。 1. 全參數微

面試 , 壓測 , 測試開發 , 人工智能 , 深度學習 , 大模型

收藏 評論

MegEngine_bot - MegEngine Python 層模塊串講(中)

在前面的文章中,我們簡單介紹了在MegEngine imperative中的各模塊以及它們的作用。對於新用户而言可能不太瞭解各個模塊的使用方法,對於模塊的結構和原理也是一頭霧水。Python作為現在深度學習領域的主流編程語言,其相關的模塊自然也是深度學習框架的重中之重。 模塊串講將對MegEngine的python層相關模塊分別進行更加深入的介紹,會涉及到一些原理的解釋和代碼解讀。Python層模

module , 開源 , 深度學習 , Python

收藏 評論

Fabarta - 共築國產AI+新生態!楓清科技×麒麟軟件生態強強聯合,國產AI一體機重磅發佈

11月21日,2025京津冀信創產業集羣對接交流活動在天津舉辦。大會上,集成銀河麒麟操作系統智算能力與楓清科技AI智能體平台的“坤智國產化AI一體機”隆重發布,旨在解決企業智能轉型中的痛點。同時,楓清科技與麒麟軟件達成戰略合作,標誌着楓清科技進一步融入麒麟軟件所構建的開放共贏產業生態。 作為本次大會重點展示的成果之一,“坤智AI一體機”解決方案依託銀河麒麟操作系統的智算能力賦能

微信 , 人工智能 , 深度學習 , 解決方案 , 信息技術

收藏 評論

容智信息 - 什麼是Agentic AI?通俗解釋為什麼企業都在做智能體

如果你最近頻繁聽到一個詞——Agentic AI(自主式人工智能),但又隱約覺得它不像是“又一個AI概念”,那你的直覺是對的。 我先給一個結論式判斷: Agentic AI不是AI的新功能,而是企業用AI的“新方式”。 它標誌着AI正從“會回答問題”,升級為“能把事情做完”。 這也是為什麼,過去一年裏,幾乎所有頭部企業都在密集討論“智能體”。 很多人對AI的認知,仍停留

自動駕駛 , 機器人 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

mb692180cc19df8 - 閣下AI的初衷是什麼?

閣下AI的初衷 在當今科技飛速發展、人工智能浪潮席捲全球的時代,閣下AI橫空出世,它懷揣着獨特且極具前瞻性的初衷,立志在AI領域開闢出一片嶄新的天地。 閣下AI堪稱全球首個AI工具智能體,這一開創性的定位使其在眾多人工智能產品中脱穎而出。從歷史發展的角度來看,早期的人工智能大多功能單一,僅能處理特定類型的簡單任務,如早期的語音助手可能僅能完成基本的信息查詢和簡單指令執

商業 , 人工智能 , 深度學習 , 提高工作效率

收藏 評論

AI代碼猴 - 從感知融合到全域賦能:2025年多模態大模型技術突破與實踐解析

當你向AI助手上傳一張古建築照片,它不僅能識別出"唐代斗拱結構",還能生成配套的歷史背景音頻、修復後的3D模型,甚至根據建築風格創作一首七言律詩——這不是科幻場景,而是2025年多模態大模型的常規能力。歷經數年技術迭代,AI已從單一文本處理的"文字專家",進化為融合視覺、聽覺、觸覺等多維度信息的"全能感知者"。本文將深入解析多模態大模型的核心技術突破、工程優化路徑,以及在關鍵行業的落地實踐,揭示其

數據挖掘 , 人工智能 , 深度學習

收藏 評論

容智信息 - Agent-100平台體驗報告:企業級智能體試用平台到底值不值得用?

在大量企業推進數字化、智能化的過程中,一個現實問題正在反覆出現:不是沒有AI工具,而是“能真正解決崗位問題的工具太少”。財務報銷審核依然堆積、盡職調查週期依然漫長、保險方案匹配仍靠人工經驗、市場分析離不開IT排期、客服與運營被重複性工單吞噬精力……這些問題並非企業不願投入,而是過去多數AI產品並未圍繞真實業務流程設計。在此背景下,我們對Agent-100智能體試用平台進行了系統化體驗與實測

自動駕駛 , 機器人 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

青否Ai - 青否ai超級員工,構建AI智能體全方位智管體系,迎接智能體員工時代!

隨着人工智能技術的飛速發展,組織形態正在經歷一場前所未有的變革。智能體員工,這些曾經只存在於科幻小説中的角色,正逐漸成為現實,並在未來組織中扮演着越來越重要的角色。 AI智能體從最初的輔助工具,轉變為潛在的“員工”,這一角色轉變不僅引發了行業內對於管理模式的深刻反思,也預示着生產力的一次重大飛躍。 智能體員工超越傳統人類員工的能力,能夠並行處理多項任務,具有強大的數據處理和分析能力,甚至能在無人類

人工智能 , 深度學習

收藏 評論

mob64ca14116c53 - AI 學習必知的十大深度學習方法!

NVIDIA-GPU 標量 / 向量 / 矩陣 / 張量 你提的問題很關鍵,這些概念是理解大模型數據流轉和計算邏輯的基礎。簡單説,它們是不同維度的“數值容器”,在大模型中分別承擔着存儲單個參數、單個特徵、批量特徵和高維複雜特徵的角色。 1. 標量(Scalar):單個數值,0維 標量是最簡單的“數值容器”,只有大小,沒有方

數組 , 標量 , 權重 , 後端開發 , 人工智能 , 深度學習 , Python

收藏 評論

求知上進 - Python 數據結構:淺拷貝與深拷貝

在 Python 編程中,理解數據結構的拷貝機制是非常重要的,尤其是在處理複雜數據類型時。淺拷貝和深拷貝是 Python 中兩個關鍵概念,它們在內存管理和數據操作中扮演着至關重要的角色。本文將對淺拷貝與深拷貝進行深入探討,內容包括基本概念、實現方式、區別、使用場景以及最佳實踐,力求為讀者提供全面的理解。 一、拷貝的基本概念 在 Python 中,拷貝是指創建一個對象的

深拷貝 , 淺拷貝 , 人工智能 , 深度學習 , 嵌套

收藏 評論

一點人工一點智能 - 《深度學習數學基礎》

書籍:Mathematical Foundations for Deep Learning 作者:Mehdi Ghayoumi 出版:Chapman and Hall/CRC​ 編輯:陳萍萍的公主@一點人工一點智能 下載:書籍下載-《深度學習數學基礎》 01 書籍介紹 《深度學習數學基礎》彌合了理論數學與人工智能(AI)實際應用之間的鴻溝。本指南深入探討驅動現代深度

數學 , 人工智能 , 深度學習

收藏 評論

mob64ca140beea5 - Spark機器學習實戰 (十二) - 推薦系統實戰 - JavaEdge的個人空間 -

Spark Cluster模式下DDP網絡配置解析 問題的核心 在Spark cluster模式下,executor是動態分配的,這引發了一個問題: DDP需要master_addr和master_port 但我們怎麼知道executor的IP? 端口會不會衝突? 關鍵理解:DDP進程都在同一個E

機器學習 , spark , 人工智能 , 深度學習 , 網絡 , Css , 前端開發 , HTML

收藏 評論

boyboy - RNN的算子

深度學習在推薦中發揮的作用: 能夠直接從內容中提取特徵,表徵能力強 容易對噪聲數據進行處理,抗噪能力強 可以使用循環神經網絡對動態或者序列數據進行建模 可以更加準確的學習user和item的特徵 基於DNN的推薦算法 推薦系統和通用搜索排序問題共有的一大挑戰為同時具備記憶能力和泛化能力。 記憶能力可以解釋

機器學習 , 深度學習推薦系統 , DNN , 人工智能 , 深度學習 , 推薦算法 , RNN的算子

收藏 評論

Fabarta - 強強聯合!楓清科技攜手麒麟OS發佈「雲邊端協同AI智能體聯合解決方案」

AI正加速成為企業業務創新與效率提升的核心動力,在國家政策推動下,AI與實體經濟的深度融合已成為趨勢,企業向“知識化、智能化”升級已成共識。但企業轉型中痛點顯著:一是知識資產分散孤島,難以整合為可共享且安全可控的企業級知識庫;二是AI應用落地難,企業知識呈多模態且結構複雜,難以解析並支撐AI應用。同時,個人辦公面臨 “知識過載”,與企業系統存在數據斷層。 11月20日,楓清科技

服務器端 , 企業級 , 人工智能 , 深度學習 , 解決方案

收藏 評論

Lab4AI - 【項目復現上新】Karpathy開源GitHub高分項目NanoChat!僅用100美元+8000行代碼手搓ChatGPT

The best ChatGPT that $100 can buy. 10 月 13 日,AI 領域大神 AndrejKarpathy 發佈了自己的最新開源項目。截至當前,​GitHub 項目上已經達到 29.1KStar​。 nanochat 是什麼 nanochat 是 AI 領域專家 AndrejKarpathy 發佈的開源項目,該項目包含從數據準備、預訓練、中期訓練、監督微調(S

機器學習 , 圖像識別 , 自然語言處理 , 知識 , 深度學習

收藏 評論

wx6906fb3f9b17a - 智能門禁系統是集計算機技術、微控制技術、智能卡技術與機電一體化技術於一體的現代化出入口管理控制系統,通過權限設置、實時監控與異常報警實現安全管理,支持生物識別、射頻卡、密碼及NFC等多種技術,滿足不同

智能門禁系統通過集成多種先進技術,實現了從傳統機械鎖具到現代智能化管理的轉變,不僅提高了安全性,還大大提升了管理效率。隨着技術的不斷髮展,智能門禁系統將在更多領域發揮重要作用,為人們的生活和工作提供更加安全、便捷的保障。 關於智能門禁系統的方案確定。用户需要了解門禁系統的組成結構、硬件安裝配置、軟件安裝設置及日常維護操作,同時需要補充門禁系統的技術原理、通訊協議和應用場景等

人臉識別門禁 , 門禁 , 門禁機 , 人工智能 , 深度學習 , 二維碼門禁 , 門禁考勤機

收藏 評論

拓端tecdat - 2025全球量子計算產業發展展望報告:技術路線、市場規模與應用落地|附200+份報告PDF、數據、可視化模板彙總下載

原文鏈接:https://tecdat.cn/?p=44713 原文出處:拓端抖音號@拓端tecdat 引言 當谷歌Willow芯片實現量子糾錯關鍵突破,中國“祖沖之三號”刷新超導量子計算性能基準,全球量子計算產業已從“實驗室小眾探索”邁入中美雙極競速的戰略博弈新階段。20餘年技術演進,讓量子計算從理論構想成為重塑全球科技版圖的核心變量——一個擁有100個量子比特的系統,理論上可並行處理2

機器學習 , 數據挖掘 , 算法 , 人工智能 , 深度學習

收藏 評論

JavaEdge - 從 100 TPS 到 700+!微服務登錄性能調優與 BLOCKED 鎖定位實戰

0 前言 前文還沒優化完,接着來折騰。 登錄要對個人信息對比驗證,驗證過程又要調用相應加密算法,而加密算法對性能要求很高。複雜加密算法安全性高,但性能差;不復雜加密算法性能好,但安全性低,要取捨。還有Session存儲和同步。大型系統,不管你在哪個系統訪問,調用其他系統時如需驗證身份就要同步Session信息,且做業務時,也要把相應Session信息帶上,不然就識別不

加密算法 , yyds乾貨盤點 , 人工智能 , JAVA , 深度學習 , ide

收藏 評論

思考的袋鼠 - 精確的動態聯動閉環醫療數據庫審計和監測方案

概要: (提示:本章節概述方案整體價值,強調數據化落地與可視化管理成果。) 在醫療行業數字化和智能化進程加速的背景下,醫療數據庫安全面臨前所未有的挑戰。患者身份信息、病歷記錄、影像數據、檢驗結果、處方信息及支付交易數據等構成了醫療機構最核心的數據資產,其敏感性和價值均極高。一旦泄露或被篡改,不僅可能引發嚴重的隱私和法律風險,也會影響醫院的運營和公眾信任。針對這一行業痛

字段 , 數據庫 , 數據庫安全 , 人工智能 , 深度學習

收藏 評論