tag 深度學習

標籤
貢獻335
506
05:25 PM · Oct 25 ,2025

@深度學習 / 博客 RSS 訂閱

Lab4AI - 7M參數,幹翻巨無霸LLM!這款超小遞歸模型(TRM),在ARC-AGI上證明了“少即是多”

01 論文概述 論文標題:Less is More: Recursive Reasoning with Tiny Networks 作者團隊:三星AI實驗室(Samsung SAIL Montréal) 發佈時間:2025年9月6日 論文鏈接:https://arxiv.org/pdf/2510.04871 👉您可以跳轉到 Lab4AI 平台上去閲讀論文原文。 Lab4AI

機器學習 , 神經網絡 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

MIAOYUN - MIAOYUN | 每週AI新鮮事兒(11.28-12.05)

本週全球科技企業密集發佈AI領域新成果,騰訊、崑崙萬維、快手、Meta、智譜AI、生數科技、DeepSeek、Runway、NVIDIA、華為、Mistral AI、阿里、火山引擎、可靈AI等推出多模態、3D生成、視頻生成、推理優化等方向新模型,聚焦性能提升與商業化適配;技術上,華為發佈MoE推理優化技術、商湯開源原生多模態架構;同時,階躍星辰開源 GUI 智能體,拍我AI、Anuttacon推出

資訊 , 自動駕駛 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

一點人工一點智能 - 書籍-《自然語言理解解析》

書籍:Understanding Natural Language Understanding 作者:Erik Cambria 出版:Springer​ 編輯:陳萍萍的公主@一點人工一點智能 下載:書籍下載-《自然語言理解解析》 01 書籍介紹 大約半個世紀前,AI先驅們如Marvin Minsky開始了一項雄心勃勃的項目:模擬人類大腦如何編碼和解碼意義。雖然現在我

自然語言處理 , 人工智能 , transform , 深度學習

收藏 評論

mob64ca14092155 - 深度學習 知識蒸餾原理詳解 蒸餾原理和過程

目錄 背景 模型結構 模型效果 實現代碼 背景 模型結構 訓練過程 實現代碼 前言 本文主要介紹知識蒸餾原理,並以BERT為例,介紹兩篇BERT蒸餾論文及代碼,第一篇論文是在下游任務中使用BiLSTM對BERT蒸餾,第二篇是對Transformer蒸餾,即TinyBert。

深度學習 知識蒸餾原理詳解 , 損失函數 , 人工智能 , 深度學習 , 概率分佈 , Git

收藏 評論

星星上的柳樹 - 常見觸發器類型解析

“觸發器決定了數字電路的“節奏與記憶”。” 在數字系統中,觸發器(Flip-Flop)是構建時序邏輯電路的核心元件。它能夠存儲一個二進制狀態,並在時鐘或控制信號的作用下改變輸出。不同類型的觸發器在功能和用途上略有差異:有的僅在特定時鐘沿觸發狀態變化,有的支持置位、復位或翻轉操作。理解各種觸發器的特性,是掌握寄存器設計、計數器實現以及有限狀態機建模的基礎。 1、觸發器的基本概念觸發器是一種雙穩

資訊 , 教程 , 知識 , 人工智能 , 深度學習

收藏 評論

一線數智 - AI時代 客户標籤體系為什麼必須重做?

  【一線數智資訊】在過去十多年的移動互聯網年代,客户運營一直圍繞“標籤”展開:年齡、性別、消費頻次、品類偏好……,基於大數據的標籤same like方式推薦,但當企業進入 AI 原生時代,大模型、向量數據庫、智能體開始走進業務,傳統標籤體系正在快速失效。   不是傳統標籤不重要,而是客户已經變了,業務節奏變了,而標籤體系沒變就會有問題。所以就出現了

靜態屬性 , 數據 , 自動生成 , 人工智能 , 深度學習

收藏 評論

全棧技術開發者 - 如何理解「128倍更少數據,卻能獲得更強智能體行為」?如何直觀地理解「少即是多(Less is More)」在智能體訓練中意義?

在人工智能尤其是智能體訓練領域,數據量的需求長期被認為是提升模型行為表現的核心驅動力。傳統強化學習方法和深度學習策略普遍依賴大量訓練數據,以期覆蓋智能體在複雜環境中可能遇到的各種狀態和動作組合。這種大規模數據驅動的訓練模式在某種程度上保證了智能體策略的穩健性和泛化能力,但同時也帶來了顯著的資源消耗、計算壓力以及訓練效率低下的問題。尤其在高維環境和複雜任務下,數據量呈指數級增長,訓

yyds乾貨盤點 , 數據 , 模塊化 , 人工智能 , 深度學習 , 子任務 , 大模型

收藏 評論

咕泡科技 - 代碼的未來:當AI學會創造,我們技術人的價值何在?

AI與大模型,已如電力和互聯網般融入我們工作和生活的方方面面。當技術從分析過去邁入生成未來,企業與技術人又該如何重塑自身價值?我們又該如何藉助這一波技術浪潮,實現能力的跨越與職業的突破? 11月16日,咕泡科技聯合創始人、AI大模型事業部負責人譚鋒(Mic)老師受邀參與“數有引力·Sure沙龍丨AI時代,個體機遇新選擇”深度沙龍進行分享,與眾多行業同行展開探討:大模型不僅改

應用層 , 人工智能 , 深度學習 , 生成式 , 迭代 , 大模型

收藏 評論

求知上進 - Python函數的返回值介紹

1.前言 1.1 返回值的基本概念 在Python函數設計中,返回值是函數執行後向調用者提供結果的關鍵機制。簡單來説,返回值允許函數不僅僅執行操作,還能將計算結果、狀態信息或數據結構傳遞迴調用代碼,從而實現代碼的複用和邏輯分離。Python使用return語句來定義返回值,這使得函數可以返回任意類型的對象,如數字、字符串、列表、字典甚至是其他函數。返回值是函數簽名的一

生成器 , 人工智能 , 深度學習 , ide , Python

收藏 評論

deephub - JAX 訓練加速指南:8 個讓 TPU 滿跑的工程實戰習慣

TPU 訓練的真實效率往往取決於兩個核心要素:Shape 的穩定性與算子的融合度。 很多時候,JAX 任務之所以出現嚴重的性能瓶頸,並非算法本身設計有問題,而是忽視了 XLA 編譯器與底層硬件對“確定性”的極度偏好。基於大量實戰調優經驗,本文總結了八條能讓 JAX 訓練任務從“甚至跑不通”蜕變為“跑滿 TPU 算力”的工程經驗。 1、儘早鎖定 Shape TPU 喜歡靜態 Shape,JA

jax , 人工智能 , 深度學習 , Python

收藏 評論

mb691327edb400f - 告別招聘焦慮:AI賦能HR從流程執行者到價值創造者

告別招聘焦慮:AI賦能HR從流程執行者到價值創造者 招聘季如期而至,簡歷堆積如山,面試日程排滿日程表,HR卻仍困在無盡初篩、重複問答與主觀判斷的循環中。團隊用人需求迫在眉睫,寶貴時間卻被瑣碎流程切割,低效、主觀、高成本的招聘模式,正悄然消耗組織活力與HR的核心價值。AI時代的到來,讓打破枷鎖成為可能——HR不應是“流程的奴隸”,而應藉助技術鑰匙,成為真正的“價值創造者”。

聊天機器人 , 上傳 , 人工智能 , 深度學習 , 解決方案

收藏 評論

雨大王 - 數字化協同研發平台怎麼助力車企轉型?

隨着工業4.0時代的到來,傳統制造業正面臨前所未有的挑戰。在研發領域,車企普遍遭遇數據孤島、知識斷層和跨部門協同效率低下的問題。這些問題不僅拖慢了產品迭代速度,還導致研發成本居高不下。例如,某大型整車企業在零部件設計階段頻繁返工,僅模具調整一項就耗費數月時間,直接經濟損失高達數千萬。此時,數字化協同研發平台應運而生,成為車企突破研發瓶頸的關鍵基礎設施。 數字化協同研發平台的核心在於“全要素連

人工智能 , 深度學習

收藏 評論

liutao988 - deepseek生圖

斯坦福大學在三月份開設了一門“深度學習與自然語言處理”的課程:CS224d: Deep Learning for Natural Language Processing,授課老師是青年才俊Richard Socher,他本人是德國人,大學期間涉足自然語言處理,在德國讀研時又專攻計算機視覺,之後在斯坦福大學攻讀博士學位,拜師NLP領域的巨牛Chris Manning和Deep Le

deepseek生圖 , 自然語言處理 , 機器翻譯 , aigc , 深度學習 , bard

收藏 評論

u_17398972 - 藍耘 MaaS 平台 API 工作流開發實錄:玩轉智能客服搭建

聲明:文章為本人平台測評博客,非廣告,並沒有推廣該平台 ,為用户體驗文章 引言 在客户服務數字化轉型中,傳統智能客服開發面臨「週期長、調試難、成本高」三大痛點:從意圖模型訓練到多渠道接入,往往需要數週時間和專業團隊支持。 藍耘元生代 MaaS 平台通過標準化 API 工作流,讓開發者無需關注底層架構,只需聚焦業務邏輯,即可在 3 小時內完成智能客服系統的搭建與上線。 平台註冊

插入圖片 , API , 人工智能 , 深度學習 , Json

收藏 評論

疆鴻智能研發中心 - 老產線的新靈魂:疆鴻智能PROFIBUS轉RS485,讓扎染精度飛躍

老產線的新靈魂:疆鴻智能PROFIBUS轉RS485,讓扎染精度飛躍 1 項目背景 去年夏天,我所在的團隊接到某紡織廠扎染車間設備改造項目。該車間原有的西門子PLC系統通過PROFIBUS總線控制部分設備,而新增的六台高精度伺服驅動器僅支持RS485接口。生產主管向我們反映,兩種協議不兼容導致染布張力控制不同步,次品率上升了15%。 在扎染工藝中,染料侵染均勻

profibus , 協議轉換網關 , 工業通訊 , RS485 , 人工智能 , 深度學習 , 工業自動化

收藏 評論

mob64ca14133dc6 - 用10行Python代碼,實現AI目標檢測技術!(Python是最好的語言)-

引言 人工智能(AI)——一個熟悉又神秘的詞彙。我們常聽説它可以生成詩歌、編寫代碼、創作藝術,甚至回答各種問題。然而,當你想親手實現一個“AI模型”時,卻可能感到無從下手。這篇教程正是為你準備的,將帶你從零開始,逐步掌握從“AI新手”到“能夠搭建AI模型”的核心技能。 一、AI的基本概念 1.什麼是AI模型? AI模型是通過訓練得到的一種程序,能夠利用海量

數據 , 神經網絡 , 深度學習 , Css , 前端開發 , HTML

收藏 評論

baihai - 剖析大模型產生幻覺的三大根源

編者按: 為什麼大語言模型總是“一本正經地胡説八道”?它們是在故意欺騙,還是被訓練機制“逼”成了這樣? 我們今天為大家帶來的這篇文章指出:幻覺並非模型的故障,而是當前訓練與評估機制下的一種理性選擇 —— 當模型因進行猜測獲得獎勵、因坦白“我不知道”而被懲罰時,編造答案就成了最優策略。 文章系統剖析了幻覺的三大根源:預訓練階段以統計預測替代事實判斷、後訓練

llm , AI , 人工智能 , 深度學習 , 大模型幻覺

收藏 評論

deephub - Scikit-Learn 1.8引入 Array API,支持 PyTorch 與 CuPy 張量的原生 GPU 加速

Scikit-Learn 1.8.0 更新引入了實驗性的 Array API 支持。這意味着 CuPy 數組或 PyTorch 張量現在可以直接在 Scikit-Learn 的部分組件中直接使用了,且計算過程能保留在 GPU 上。 1.8.0 到底更新了什麼? Scikit-Learn 開始正式支持Python Array API 標準。這是一個由 NumPy、CuPy、PyTorch、J

神經網絡 , pytorch , 人工智能 , 深度學習 , sklearn-pandas

收藏 評論

雨大王 - 製造業數字化服務商如何助力企業轉型?

製造業數字化服務商:轉型的催化劑與企業夥伴 在當前全球製造業加速向數字化和智能化邁進的時代背景下,數字化服務商已成為推動企業變革的關鍵力量。回想一下,製造業的數字化轉型不僅僅是跟上技術的步伐,更是企業從傳統模式中解脱出來、實現可持續發展的必經之路。這些服務商像一位經驗豐富的顧問,幫助企業橋接現實與數字世界,但他們的價值遠不止於此;它們不僅僅是提供軟件或硬件的供應商,而是通過整合資源、化解痛點

人工智能 , 深度學習

收藏 評論

ceshiren2022 - Playwright MCP:AI驅動自動化測試,輕鬆告別傳統腳本編寫

2025年初,某知名電商公司在引入Playwright MCP後,UI自動化測試腳本編寫時間從原來的3天減少到2小時,測試覆蓋率提升了40%,而這一切,測試人員幾乎沒有編寫一行傳統腳本。 在傳統的UI自動化測試中,測試人員需要編寫大量腳本和選擇器來模擬用户操作。然而,隨着人工智能技術的快速發展,對話式自動化正在改變這一格局。 Playwright作為微軟開源的現代化We

選擇器 , 服務器 , 人工智能 , 深度學習 , 自動化測試

收藏 評論

JavaEdge - LinkedIn 的遷移之路:從批處理到實時推薦,服務數十億用户

——Nishant Lakshmikanth 於 QCon San Francisco 2025 分享 在 2025 年的 QCon San Francisco 大會上,LinkedIn 工程經理 Nishant Lakshmikanth 深入講述了 LinkedIn 如何系統性地拆解其傳統的批處理式推薦系統,逐步實現實時個性化推薦,並顯著提升運算效率。 舊的推薦架構

批處理 , yyds乾貨盤點 , 離線 , 個性化推薦 , 人工智能 , 深度學習

收藏 評論

合合信息解決方案 - 醫療票據識別技術如何實現

在醫療數字化轉型的浪潮中,票據處理一直是困擾醫保審核、商業保險理賠、醫院財務管理的“老大難”。全國各地醫療機構出具的票據版式千差萬別,複雜的表格結構、低質量的圖像採集,讓傳統人工錄入效率低下、錯誤頻發。合合信息TextIn平台重磅推出的醫療票據識別產品,通過深度學習與OCR技術的深度融合,為這一行業痛點提供了精準高效的解決方案。 OCR技術奠定識別基礎 醫療票據識別的

預處理 , 機器學習 , 人工智能 , 深度學習 , 圖像質量

收藏 評論

疆鴻智能研發中心 - EtherCAT轉MODBUS RTU網關:賦能注塑模具廠“智”造升級

EtherCAT轉MODBUS RTU網關:賦能注塑模具廠“智”造升級 在智能化浪潮席捲製造業的今天,位於長三角的一家大型注塑模具廠卻面臨着“新舊設備協同”的難題。作為生產核心的倍福(Beckhoff)PLC憑藉其高性能的EtherCAT總線,高效地控制着伺服驅動器、I/O模塊等現代設備,構成了工廠的“高速神經中樞”。然而,車間內大量仍在穩定運行的“老功臣”——如注塑機輔機

協議轉換 , 人工智能 , 深度學習 , ETHERCAT , 網關 , 工業自動化 , Modbus

收藏 評論

小白獅ww - 單卡 4090 即可啓動,一鍵部署 QwQ-32B-AWQ 教程

QwQ 是 Qwen 系列的推理模型,相比傳統指令調優模型,QwQ 具備思考和推理能力,在下游任務尤其是難題上能取得顯著性能提升。QwQ-32B 是中型推理模型,能夠與 DeepSeek-R1、o1-mini 等最先進的推理模型取得競爭性性能。\ 教程鏈接:https://go.openbayes.com/d6USh 使用雲平台:OpenBayes\ http://openbayes.

tensorflow , 自然語言處理 , 數據庫 , 人工智能 , 深度學習

收藏 評論