tag 人工智能

標籤
貢獻960
1526
06:37 AM · Oct 27 ,2025

@人工智能 / 博客 RSS 訂閱

deephub - dLLM:複用自迴歸模型權重快速訓練擴散語言模型

大語言模型的文本生成方式一直都是以自迴歸為主:一個token接一個token,從左往右,生成完就定了。 但現在有個不太一樣的思路開始在研究圈裏流行起來,那就是擴散語言模型(Diffusion LMs)。擴散模型在圖像生成領域已經證明了自己的可行性,但是問題是把這套東西用到文本上一直很麻煩——訓練難、評估難、更別提怎麼集成到現有的LLM工作流裏了。 dLLM是一個開源的Python庫,它把擴

llm , 人工智能 , 深度學習 , Python

收藏 評論

架構師李哲 - 大模型微調有必要做嗎?全參數微調、LoRA還是RAG?看完這篇你就懂了

在人工智能迅猛發展的今天,大型語言模型已成為解決各類問題的強大工具。但當您想要打造一個真正理解所在行業、掌握專業知識的大模型時,總會面臨一個關鍵問題:如何用最小的成本、最高的效率,讓通用模型變得"專業"? 這就像把一位通才培養成領域專家——選對方法,事半功倍。這正是LLaMA-Factory Online要解決的核心問題——通過智能化的微調,讓每個團隊都能輕鬆駕馭大模型適配

實時更新 , 數據 , 人工智能 , 深度學習 , 迭代

收藏 評論

圍爐聊科技 - TRAE SOLO:使用初體驗

國內版TRAE SOLO之前就有預約,近期終於等到了,SOLO模式確實讓我大開眼界。它不再只是一個代碼補全工具,而是真正能從需求到上線全程陪跑的"編程夥伴"。 一、激活與界面切換:看似簡單,實則有門道 首先,獲取TRAE SOLO的途徑並不難。國內用户現在可以直接在TRAE國內版中免費使用SOLO模式。 切換SOLO模式的按鈕位於TRAE左上角,點擊後界面會從傳

機器學習 , 技術棧 , 代碼生成 , 人工智能

收藏 評論

mob64ca13f7ecc9 - element plus 日曆 預約

本章節要完成的功能為通過點擊日曆中的設置按鈕來設置對應日期的可預約人數。效果如下: 完善頁面 為設置按鈕綁定事件 為日曆中的設置按鈕綁定單擊事件,當前日期作為參數 button v-if="dayobject.day today" @click="handleOrderSet(dayobject.day)" class

機器學習 , 映射文件 , 當前日期 , Ajax , 人工智能 , element plus 日曆 預約

收藏 評論

CloudWeGo - 用 Eino ADK 構建你的第一個 AI 智能體:從 Excel Agent 實戰開始

本文將會向您介紹如何利用 Eino ADK (Agent Development Kit) 構建一個強大的多智能體系統。 以 Excel Agent 這個實際業務場景為基礎,Excel Agent 是一個能夠“聽懂你的話、看懂你的表格、寫出並執行代碼”的智能助手。它把複雜的 Excel 處理工作拆解為清晰的步驟,通過自動規劃、工具調用與結果校驗,穩定完成各項Excel數據處理任務。 接下來我們將從

agent , 微服務 , 教程 , excel , 人工智能

收藏 評論

lanhy - 迴歸任務中標籤值跨度較大怎麼解決

文章目錄 1. 垃圾回收的簡單回顧 2. 三色標記法 2.1 基本算法 2.2 多標-浮動垃圾 2.3 漏標-讀寫屏障 2.3.1 寫屏障(Store Barrier) (1) 寫屏障 + 增量更新 (2) 寫屏障 + SATB

機器學習 , 成員變量 , 記法 , 人工智能 , 增量更新 , 迴歸任務中標籤值跨度較大怎麼解決

收藏 評論

沃觀態勢感知 - 從數據到決策:海外社交媒體分析服務如何指引企業的市場戰略

在全球競爭迅速加劇的環境中,企業的市場戰略不再能依賴單一渠道或過往經驗來制定,而必須以海量數據為基礎,通過結構化的洞察模型去判斷趨勢、識別機會並預判風險。海外社交媒體作為用户意見、消費行為、文化趨勢最集中的場域,已經成為企業戰略規劃中最關鍵的前置數據源。海外社交媒體分析服務的價值,也因此從“輔助工具”升級為“戰略基礎設施”,決定了企業在海外能否看得更準、走得更穩。 市場戰略

數據 , 人工智能 , 數據分析 , 社交媒體 , 結構化

收藏 評論

煜見Ai未來 - 我見證了三次造富:小米10年、比特b 8年、Manus只用了8個月

第一次:2010年,小米 我中學同學的大學室友,是小米聯合創始人之一。 2010年小米成立的時候,小米説我們要做中國的蘋果 當時的故事就不多説了——華強北那麼多山寨手機,憑什麼你能做成? 結果呢? 小米用了10年,2020年衝進世界手機出貨量前三,估值破千億美元。 那位聯創,早就財富自由了。 我的感受:這輩子能遇到一次這種機會,就

機器學習 , 區塊鏈 , 人工智能 , 估值 , 小米手機

收藏 評論

bugyinyin - 【收藏必備】基於Qwen微調用户分類意圖模型,準確率碾壓DeepSeek V3,小白也能學會的大模型實戰

序言 大模型已經深入到我們的生活的方方面面,不知不覺中我們的手機電腦,電子設備、辦公需求都被大模型所顛覆,那麼擁抱AI大模型已經是不可阻擋的一個發展趨勢!微調大模型成為必須的一門技能! 擁抱AI從大模型運行環部署開始 本片文章將會三篇文章來詳細描述大模型的環境部署、模型微調、實戰微調一個意圖分類小模型、實戰記錄下用户分類意圖模型是怎麼練

大模型教程 , AI大模型 , 後端開發 , 人工智能 , 大模型入門 , 大模型學習 , Python

收藏 評論

高德開放平台 - 智能手錶地圖新體驗,RTOS系統助力全球行

高德開放平台智能手錶解決方案上線!RTOS系統來襲,卓越性能開啓智能手錶地圖新體驗!6大服務優勢,海量數據直達腕間。融合多品類地圖服務,全面滿足運動出行、智能守護等場景的用户需求,適配各類智能手錶、智能手環,打造智能穿戴生態。

地圖開發 , 數據挖掘 , 地圖api , 人工智能

收藏 評論

數據科學家 - F12 elements 修改內容後如何運行

1.需求: -- 在培訓班管理的時候,目前後台沒有提供作業提交的情況統計清單,而且無法查看作業,只有點開統計,能看到作業提交的清單 但是這個頁面是個彈窗,只有關閉按鈕,中間是10個人的作業記錄,然後下面一排是頁碼按鈕 ,這次戰略百問的頁碼是173頁 目的是要把每頁的表格內容複製出來,粘貼到一個表裏面。 如何快速的一次性獲得所有的,哪怕是txt後

機器學習 , 換頁 , 賦值 , 人工智能 , HTML

收藏 評論

程序員阿偉 - 《獨立遊戲社區支持的生態構建與共創賦能指南》

獨立遊戲的突圍之路,從來不是閉門造車式的研發深耕,更在於能否搭建起與玩家深度綁定的情感橋樑,而自有網站正是這座橋樑的核心支柱—它絕非傳統認知中單純的遊戲展示窗口,而是集互動、共創、沉澱於一體的社區生態樞紐,是讓玩家從“被動體驗者”轉變為“主動共建者”的價值載體。當下許多獨立開發者陷入“平台流量依賴症”,將大量精力投入到各大遊戲平台的曝光運營中,卻忽視了自有陣地的長效價值:平台流量受算法波動影響極大

遊戲 , 人工智能

收藏 評論

mb691327edb400f - 招聘決勝起跑線:AI重構決策級招聘新範式

招聘決勝起跑線:AI重構決策級招聘新範式 HR們正面臨一個隱性危機:招聘已從“流程執行”變成“高風險決策”。候選人數量爆炸、崗位要求細分、業務週期壓縮,可面試仍依賴個人經驗與主觀判斷——一旦選錯人,代價遠非“再招一次”,而是業務延誤、團隊失衡,甚至錯失市場窗口期。全球調研機構Gartner早已預判:2025年,超60%的大型企業將採用AI面試技術。這不是“要不要用”的選擇題

鏈路 , 一對一 , 人工智能 , 深度學習 , 解決方案

收藏 評論

mob64ca140ce312 - Windows Management Instrumentation總莫名佔用CPU

OWSTIMER.EXE causes a high CPU usage 自從安裝WSS3之後,不定時會發現OWSTIMER.EXE Process的CPU使用量忽然衝高,同時HD聲不斷閃爍的狀況。前後不定時發生過好幾次,今天終於忍不住用Process Monitor追了一下,發現有個寫入C:Program FilesCommon Files

機器學習 , SharePoint , google , 人工智能 , 關鍵程度

收藏 評論

Java中文社羣 - 別再付費生圖了!N8N+即夢4.5無限免費用!

兄弟們,發現沒?即夢(Jimeng)的4.5圖片生成大模型悄悄上線了! 這波更新可不是小打小鬧,不僅模型能力大幅提升,更關鍵的是,我又給大家挖到了一條免費在工作流中調用它的路子。 今天這篇文章,咱們就來聊聊即夢 4.5 到底強在哪,以及如何不花一分錢 API 費用,把這波羊毛薅到手! 🎥 視頻展示 www.bilibili.com/video/B

API , 普通用户 , 後端開發 , 人工智能 , Docker , harmonyos

收藏 評論

雨大王 - 汽車焊接工藝自適應控制技術的系統解析與工業實踐

隨着全球製造業向智能化、柔性化方向演進,焊接作為汽車製造的核心工藝,其技術升級已成為提升整車質量與生產效率的關鍵抓手。尤其在新能源汽車、輕量化車身等高要求領域,傳統焊接工藝因其參數固定、適應性差的侷限性,難以滿足複雜工況下的精準控制需求。在此背景下,焊接工藝自適應控制技術應運而生,成為行業發展的新引擎。 一、焊接工藝自適應控制的核心原理與理論基礎 焊接工藝自適應控制是一種基於實時反饋與

人工智能

收藏 評論

codigger - Codigger 的 AI 哲學:不僅是“生成”,更是“理解”

當市面上大多數 AI 編程工具仍停留在“根據提示詞生成一段代碼”的淺層輔助階段時,Codigger 已提出一套更為深刻的 AI 賦能邏輯。這張架構圖貫穿上下的“AI 大模型賦能”路徑,揭示了其獨特的“雙向驅動”機制。 向下紮根:如同架構師般深度思考 Codigger 的 AI 並非僅限於表層交互,而是通過特定的擴展點,深度嵌入底層的基礎架構層、語言層(ObjectSense)

編輯器 , 算法 , 人工智能 , JAVA

收藏 評論

deephub - 從零開始訓練推理模型:GRPO+Unsloth改造Qwen實戰指南

推理型大語言模型現在確實火了。這類模型的特點是會先對問題做充分思考,然後再給出答案,而不是直接回復。 雖然早期訓練推理型 LLM 的方法多半被各家公司當作核心機密,但最近的DeepSeek-R1、DeepSeekMath、Kimi-k1.5 和 DAPO 這些項目都公開了相關流程。 這些方法讓 LLM 在推理過程中生成更長的思維鏈(Chain-of-Thought,CoT)輸出,推理效果因此得到提

llm , 神經網絡 , 教程 , 人工智能 , 深度學習

收藏 評論

mob64ca13fb6939 - memtester linux命令 失敗

關於ROS Why is ROS not a real-time operating system? ROS isn't even an operating system, it's a framework and it's usually built on top of Ubuntu. First and foremost,

機器學習 , 優先級 , 任務調度 , 人工智能 , Ubuntu

收藏 評論

星星上的柳樹 - 功耗網路籤核工具大盤點

“功耗/IR/EM 分析是芯片籤核不可或缺的一環。” 隨着製程節點縮減、堆棧 3D-IC 與片上系統(SoC)複雜度提升,芯片設計中功耗送配網絡 (PDN ) 的 IR 壓降、 EM 風險與熱耦合效應成為性能與可靠性籤核的瓶頸。早期忽視這些因素可能導致後段 tape-out 失敗或壽命衰減。為此,業界推出了多款專用於功耗/IR/EM 籤核的工具,幫助設計團隊在流片前完成全片分析、根因定位與閉

資訊 , 教程 , 知識 , 人工智能 , 深度學習

收藏 評論

全棧技術開發者 - 如何理解CNN在CV與NLP領域運用的聯繫與區別?跨領域任務中如何協調卷積核設計、特徵匯聚和序列全局信息提取以提升整體模型性能?

在人工智能研究的發展歷程中,卷積神經網絡(CNN)因其在模式識別與特徵提取中的卓越表現,成為深度學習的重要基礎工具。CNN最初主要面向二維圖像數據,通過卷積核在局部區域提取空間模式,使得網絡能夠自動構建從低級到高級的特徵表示。然而,隨着自然語言處理技術的不斷進步,研究者發現CNN在文本序列建模中同樣具有顯著作用,能夠識別局部詞組模式、捕捉短語語義信息,並在文本分類、情感分析等任務

卷積 , 卷積核 , yyds乾貨盤點 , 人工智能 , 深度學習 , 池化

收藏 評論

老紀的技術嘮嗑局 - 向量檢索技術優化步驟詳解——遊戲公司智能客服與推薦系統落地OceanBase

作者:周強,卡牌遊戲公司高級開發工程師 向量數據庫的獨特優勢與選型經驗 向量數據庫 是專門為存儲、索引和查詢高維向量數據而設計的數據庫系統,能夠高效處理由機器學習模型生成的嵌入向量,並支持基於相似性的快速檢索。 相較於#傳統數據庫,向量數據庫在多方面顯示出其獨有的特性,可在前者涉及的領域之外發揮優勢。如圖1所示,傳統數據庫主要用於存儲結構化數據,基於精準匹配進行查詢,適用於業務數據管理,而向量數據

遊戲 , oceanbase , 人工智能

收藏 評論

多情的青蛙 - DeepSeek V3.2發佈:AI進入“效率革命”新時代

一邊是達到GPT-5水平的性能,一邊是大幅降低的計算開銷,DeepSeek V3.2正式版正在重新定義AI模型的性價比標準。 2025年12月1日,深度求索公司宣佈推出DeepSeek-V3.2和DeepSeek-V3.2-Speciale兩個正式版模型。與以往單純追求性能突破不同,此次發佈凸顯了AI產業的重要轉向:從“唯參數論”到“效率至上”的戰略轉型。 標準版V3.2在公開推理測試中達到GPT

觀點 , 資訊 , 人工智能

收藏 評論