tag 自然語言處理

標籤
貢獻52
133
07:11 PM · Oct 26 ,2025

@自然語言處理 / 博客 RSS 訂閱

曼孚科技 - 從“聽得清”到“聽得懂”:音頻標註技術的演進

在人工智能的發展圖譜中,讓機器 “聽見” 並解讀世界,始終是一條充滿挑戰卻意義深遠的探索路徑。 早期技術突破集中於一個明確目標 ——“聽得清”,即實現聲音信號向文字符號的高精度轉化。然而,隨着 AI 應用場景的持續拓展與深化,行業對機器 “聽力” 提出了更高階的要求:不僅要精準轉寫語音內容,更要深度理解其背後的內涵。 把握指令意圖、辨識話語情緒、洞悉聲音場景的複雜構成,成為人工智能向高階智能演進的

機器學習 , 算法 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

OpenBayes - OpenBayes 教程上新丨CSM 駕到,統統閃開!更鮮活的語音生成,從此告別延遲呆板機械味

與 AI 語音助手聊天時,總感覺哪裏怪怪的。它們對問題應答自如,可就是少了點「人味」。語調呆板、停頓突兀,時不時還在莫名其妙的地方卡頓,這種似人非人的違和感,其實就是「恐怖谷效應」在作祟。當 AI 語音與人類語音相似度頗高卻又未達到完美一致時,用户便會感到不適。 近期,由 Sesame 團隊推出的語音生成模型 CSM (Conversational Speech Model) 在眾多語音模型中脱穎

機器學習 , tensorflow , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

小白獅ww - 給你一個新視角看世界——Depth-Anything-3

如果説以往的 3D 視覺模型像「術業有專攻」的匠人,那麼Depth-Anything-3(DA3) 就是那個突然橫空出世、把所有活都能幹而且幹得還賊好的「全能大師」。它的秘訣很簡單:只用一個標準 Vision Transformer,就能同時搞定深度估計、相機位姿、三維重建和視角渲染。 給它一張圖,它能看深度;給它幾張圖,它能還原三維結構;給它視頻,它還能把相機怎麼動的都推出來;換個角度,它還能幫

圖像識別 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

小白獅ww - 當視覺模型開始「懂你所指」:SAM3 的能力遠超你想象

如果你曾經想過:「我能不能只用一句話,讓電腦在視頻裏自動找出所有『紅色揹包』?」或者希望在一張照片裏隨手點一下,就完成乾淨利落的分割,那SAM3正是為這些需求準備的。 隨着圖像與視頻數據的爆炸式增長,傳統分割方法往往需要大量標註或只能識別固定類別,難以應對複雜開放場景。SAM3 則通過統一的多模態輸入方式——文本、示例與視覺提示——讓模型能主動理解你的意圖,並在圖像與視頻中執行高精度檢測、分

機器學習 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

Aloudata大應科技 - 不只是問數:如何利用 Aloudata Agent 的“智能報告”功能,生成周報、月報?

過去十年,企業對數據的信仰達到了前所未有的高度。“一切用數據説話”成了管理聖經,“BI 看板”成了標配。可諷刺的是,越是標榜“數據驅動”的組織,越深陷於一種隱秘的悖論:數據越來越多,但真正被理解、被使用、被轉化為行動的信息,卻越來越少。 週報、月報本應是這種轉化的關鍵載體。但在現實中,它們常常淪為三件事的混合體: ● 數據搬運(從系統 A 複製到文檔 B ) ● 格式表演(調字體、對齊

數據挖掘 , nosql , 自然語言處理 , chatgpt , 人工智能

收藏 評論

Lab4AI - 原來用聊天記錄就可以創造數字分身!WeClone項目在Lab4AI平台上的復現

01 | WeClone如何創造數字分身 擁有一個數字分身可能是很多人的一個願望。其實通過給大模型餵我們的聊天記錄,就可打造出我們的數字分身,當前爆火的Weclone項目採取的就是這種做法。先導出自己的聊天記錄,再把聊天記錄作為數據用來微調大模型,讓模型學習我們的語言風格和習慣,就能打造出專屬的數字分身。近期,有開發者在Lab4AI大模型實驗室成功復現WeClone項目,不需要準備繁瑣的環境,很容

機器學習 , 自然語言處理 , 人工智能

收藏 評論

編程思想者 - AI智能寫作軟件寫作狐,快速生成偽原創、摘要提取、字體轉化、內容相似度檢測等等

寫論文邏輯混亂,文獻綜述無從下手,開題報告一籌莫展?別慌!懂你!無論你是正在為畢業論文頭疼的大學生,還是在為碩士論文、博士論文絞盡腦汁的研究生,或是為了職稱評定而努力撰寫期刊論文、會議論文的科研人員,AI寫論文工具都能為你提供強大的支持。掌橋科研等多款AI生成論文軟件,覆蓋了從AI寫畢業論文到AI寫課程論文,再到AI寫科普文章、AI寫開題報告、AI寫文獻綜述,甚至是AI生成畢業論

自動生成 , 自然語言處理 , 參考文獻 , 人工智能 , 數據結構與算法

收藏 評論

超神經HyperAI - 【TVM 教程】自定義優化

TVM 先已更新到 0.21.0 版本,TVM 中文文檔已經和新版本對齊。 Apache TVM 是一個深度的深度學習編譯框架,適用於 CPU、GPU 和各種機器學習加速芯片。更多 TVM 中文文檔可訪問 →Apache TVM Apache TVM 的一個主要設計目標是便於自定義優化流程,無論是用於科研探索還是工程開發,都可以靈活迭代優化過程。本教程將涵蓋以下內容: 目錄 審查整體流程 可

機器學習 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

OpenBayes - 跨語言智能再升級!Multi-LMentry 打造多語理解新基準;Nemotron-Personas-USA重塑虛擬人畫像生成

公共資源速遞 5 個公共數據集: Life Style Data 生活方式數據集 Multi-LMentry 多語言基礎任務評測基準 Nemotron Personas USA 美國人物畫像數據集 The Diabetes Health Indicators 糖尿病健康指標數據集 Global Earthquake-Tsunami Risk 全球地震海嘯風險評估數據集 訪問官網立即使

機器學習 , 圖像識別 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

OpenBayes - 教程上新丨基於AI手勢識別,僅用CPU即可定製形態多變的3D聖誕樹

裝飾聖誕樹幾乎成了每個家庭迎接節日時不可或缺的一環,彩燈一圈圈繞上樹枝,掛件、照片慢慢填滿空隙,燈亮起的那一刻,節日的氛圍也隨之到位。 隨着聖誕節臨近,小貝也為大家置辦了一棵「賽博聖誕樹」。3D Christmas Tree 是由 moleculemmeng020425 開源的一個基於 React, Three.js(R3F)和 AI 手勢識別 Web 應用。 基於 AI 手勢識別,用户可以輕鬆用

圖像識別 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

OpenBayes - DiffVox 打造下一代聲效模型;面部情感識別數據集讓 AI 讀心術成真!

公共資源速遞 6 個公共數據集: Freebayes_Benchmark 基準測試集 DiaMoE-TTS 多方言語音表音數據集 APEX 人工智能生產力評測基準數據集 BWA_Benchmark(SBC)基準測試集 DeePMD-kit_Example 勢能模型示例數據集 Facial Emotion Recognition 面部情感識別數據集 5 個公共教程 : DiffV

機器學習 , 圖像識別 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

mob649e815d334b - llama 7b原理

LLaMA 7B原理:探討與解析 LLaMA(Large Language Model Meta AI)是Meta發佈的系列大型語言模型,其中7B代表其參數量為70億個。該模型致力於提高生成預訓練模型的性能,致力於在自然語言處理(NLP)任務上取得突破。本文將探討LLaMA 7B的技術原理、架構解析、源碼分析以及擴展討論,旨在為讀者提供一個全面的理解框架。 背景描述 在過去的

初始化 , 自然語言處理 , aigc , ci

收藏 評論

袋鼠雲數棧 - AIWorks 煥新升級:把企業級 Agent 從“搭出來”到“跑起來”,一套平台搞定

大模型應用的下半場,是深入企業業務一線的 Agent 應用戰場。從初期的閒聊對話,到如今深入業務核心,企業對 AI 的訴求已經非常清晰:我們需要的不止是通用的效率工具,更是能夠理解業務邏輯、執行復雜指令、保障數據安全的生產力級智能體。 AIWorks 作為一款面向企業級場景的 AI 智能體應用開發平台,聚焦私有化部署與業務場景落地,提供安全可控、靈活擴展的 AI 應用構建能力。平台集成可視化開發、

資訊 , 自然語言處理 , 數據庫 , 人工智能

收藏 評論

小怪獸會微笑 - Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models(超長文本模型論文HSA)

Every Token Counts: Generalizing 16M Ultra-Long Context in Large Language Models(超長文本模型論文HSA) 這篇論文介紹了 HSA-UltraLong,這是一個基於 分層稀疏注意力(Hierarchical Sparse Attention, HSA) 機制的模

分塊 , redis , 語言模型 , 自然語言處理 , 點積 , 數據庫 , 人工智能

收藏 評論

容智信息 - 企業AI落地破局:五步行動指南,從價值試點到組織效能躍遷

在AI技術熱潮下,不少企業陷入“概念喧囂卻落地無門”的困境——空有技術憧憬,卻不知從何入手,或盲目鋪開後效果寥寥。容智信息基於千餘家企業智能化實踐沉澱,提煉五步行動指南,為企業提供從“AI可用”到“價值可感”的清晰路徑。 AI落地切忌“大而全”的盲目投入,需優先選擇對業務有直接價值、流程相對清晰、出錯影響可控的高價值任務切入。例如:市場營銷領域:可先試點產品智能推薦、市場策略

觀點 , 資訊 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

容智信息 - AI賦能職場:個體即團隊,效能倍增新範式

近期多項行業實踐顯示,AI工具已深度滲透職場場景:銀行合同審查AI系統可自動識別合規風險點並標註,智能協作平台3分鐘即可完成原需3小時的信貸初審文書,行政領域的AI應用亦實現日程聯動、會議室預訂及考勤統計的自動化。這一趨勢引發部分職場人士對“崗位替代”的擔憂,但本質上,AI並非職場競爭者,而是推動效率升級與價值重構的核心助力。如同20年前Excel工具作為辦公神器,當前AI工具的核心價值在

資訊 , 機器人 , 自然語言處理 , 知識 , 人工智能

收藏 評論

容智信息 - 企業智能體落地指南——拆解7大關鍵問題,附實戰避坑策略

在企業智能化轉型的進程中,智能體(AI/RPA等智能應用)本應是撬動效率與價值的槓桿,但不少企業管理層卻因踩入隱性“深坑”,導致項目延期、投入打水漂甚至引發業務風險。容智信息基於數百個企業智能化項目的實戰覆盤,提煉出智能體落地最容易踩的7大深坑及避坑核心思路,助力企業管理層在智能體佈局中“避坑增效”,讓數字化投入真正轉化為業務增長動能。 部分企業為追求“全自動化”,將核心業

機器人 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

MIAOYUN - MIAOYUN | 每週AI新鮮事兒(10.31-11.07)

本週AI領域動態密集,美團、360、銀河通用、字節、騰訊、Kimi與科大訊飛等分別發佈多模態、圖文、導航及視頻推理模型;工具層面,寒武紀、百度、崑崙萬維、騰訊均推出新平台或功能。技術方面,在長序列處理、多智能體協同及代碼執行效率上取得突破。市場方面,OpenAI與AWS達成鉅額合作,小鵬發佈人形機器人「IRON」。整體呈現高效化、多模態與實用化趨勢,一起來回顧本週發生的AI新鮮事兒吧! AI 大模

資訊 , 機器人 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

容智信息 - 企業AI智能體落地破局:5大行動建議,助管理層實現智能體從“用起來”到“價值永續”

在企業數字化轉型的賽道上,智能體(AI/RPA等智能應用)是公認的效率引擎與增長利器。但對於企業管理層而言,“如何讓智能體真正落地生效?如何避免淪為短期工具、實現長期價值放大?”這些問題始終縈繞心頭。容智信息基於數百個企業智能化項目的實戰沉澱,提煉出五大行動建議,為管理層繪製出從“智能體落地”到“價值持續深耕”的清晰路線圖。 許多企業管理層對智能體落地的最大顧慮,是“投入大

資訊 , 機器人 , 自然語言處理 , 知識 , 人工智能

收藏 評論

容智信息 - 量化智能體價值:一套指標體系,讓企業高管精準掌控AI運營的效率與質量躍遷

在企業數字化轉型的浪潮中,智能體(AI/RPA智能應用)的上線絕非終點,而是價值兑現的新起點。對於企業CEO、技術總監而言,如何量化智能體給運營效率、質量乃至業務增長帶來的真實變化?如何判斷智能體是否“物有所值”,甚至在不達預期時推動優化迭代?容智信息的“智能體指標追蹤表”,構建了一套穿透運營全維度的指標體系,為企業高層提供決策級的價值洞察。 許多企業在智能體上線後,僅以“

資訊 , 機器人 , 自然語言處理 , 教程 , 人工智能

收藏 評論

六邊形架構 - 大模型應用開發技術路線(中):大模型微調與定製從概念到落地

文 / 勇哥 原創文章,轉載請聯繫授權 關注公眾號「六邊形架構」,及時瞭解更多的技術分享和項目經驗 我是勇哥,一名在技術領域摸爬滾打10多年的技術老兵。繼上一篇《大模型應用開發技術路線(上):從概念到RAG實戰,這套方法論讓我從0到1落地企業級AI應用》之後,我想跟大家分享一下我在學習和應用大模型應用開發過程中對於大模型微調與定製的一些經驗和發現。 今天,讓我們深入剖析大模型微調

觀點 , llm , 算法 , 自然語言處理 , 人工智能

收藏 評論

MIAOYUN - MIAOYUN | 每週AI新鮮事兒(10.24-10.31)

本週AI領域迎來密集更新,視頻生成為創新焦點,字節、MiniMax等發佈的模型實現了長視頻、多鏡頭與效率突破;多模態、3D場景與智能體平台(如華為WorldGrow、智源Emu3.5、360 SEAF)取得顯著進展;同時,ChatGPT在心理安全、OpenAI在開源安全模型以及PayPal與OpenAI的生態合作上也有關鍵動作,一起來回顧本週發生的AI新鮮事兒吧! AI 大模型 中國科大與字節跳動

機器學習 , 算法 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

容智信息 - 智能體最佳實踐的方法論(五):擴展規劃

當您的企業在某個業務場景中,藉由智能體實現了效率的跨越式提升——比如財務自動化讓人力成本直降30%,智能客服讓客户滿意度飆升25%……您是否會思考:如何讓這“單點的光芒”照亮全業務版圖?如何讓智能體從“部門級工具”進化為“企業級智能基建”?這正是智能體擴展規劃的核心價值——它是企業智能轉型從“試水”到“深耕”的關鍵橋樑,是讓智能體價值從“短期紅利”升級為“長期生態優勢”的操盤密碼。接下來,

資訊 , 機器人 , 自然語言處理 , 人工智能

收藏 評論

coding進階 - 一文彙總開源大語言模型,人人都可以擁有自己的ChatGPT

前言 OpenAI發佈的ChatGPT火爆全球以來,全球互聯網大廠陸續跟進,紛紛宣佈了自家的Chat產品,如Google的Bard,百度的文心一言,阿里的通義千問等等。 這些Chat產品背後都是依賴的大語言模型(Large Language Model)。 如果是做一個垂直領域的Chat產品,有2種方案: 直接使用商業化產品,前提是商業化產品支持對模型做fine-tune(微調)。比如Open

自然語言處理 , chatgpt , openai , 人工智能 , meta

收藏 評論