tag 自然語言處理

標籤
貢獻52
132
07:11 PM · Oct 26 ,2025

@自然語言處理 / 博客 RSS 訂閱

曼孚科技 - 不止於中文:小語種文本標註——藍海市場的精細耕耘

在人工智能全球化的浪潮中,數據作為核心驅動力的價值已成為行業共識。然而,當英語、中文等大語種市場的競爭步入紅海,一片龐大且潛力無限的領域正悄然崛起:小語種文本標註。 這絕非簡單的語言種類擴充,而是一場對技術深度、文化認知與商業策略的綜合考驗。 從東南亞的多元方言到中東的複雜文字,從非洲的豐富語系到歐洲的區域語種,每一種小語種背後都對應着獨特的市場——一座尚未大規模開發的數據金礦。 耕耘這片藍海,絕

機器學習 , 算法 , 自然語言處理 , 人工智能 , prompt

收藏 評論

wx6464351503832 - 強化學習(RL)簡介及其在大語言模型中的應用

看到huggingface上有個大模型課程,其中有個章節是講如何構建推理大模型,下面是對應的學習內容。 接下來會用最通俗易懂的方式介紹RL,就算之前完全沒接觸過也能看懂。會拆解核心概念,看看為什麼RL在大語言模型(LLMs)領域變得這麼重要。 什麼是強化學習(RL)? 想象一下訓練一隻狗。想教它坐下。可能會説"坐下!",如果狗坐下了,就

強化學習 , 語言模型 , 自然語言處理 , 人工智能 , Css , 大模型 , 前端開發 , HTML

收藏 評論

小白獅ww - abaqus 算例教程:考慮動水壓力的koyna地震非線性動力響應分析

一、教程簡介 Abaqus 簡介 Abaqus 是一款功能強大的有限元分析 (FEA) 軟件,廣泛應用於工程模擬領域。它通過有限元方法對各種工程問題進行模擬和分析,能夠處理從簡單的線性問題到複雜的非線性問題。Abaqus 最初於 1978 年發佈,由 Hibbitt, Karlsson Sorensen, Inc.(HKS) 開發,後更名為 ABAQUS 公司,並於 2005 年被達索系統 (D

機器學習 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

容智信息 - 企業智能體VSRPA:不是升級,而是代際差異

企業智能體與RPA的差異,並不是“自動化程度更高”,而是是否具備自主決策能力的代際分野。 在企業數字化轉型的早期階段,RPA(機器人流程自動化)曾憑藉“降本增效”的明確價值,成為眾多企業的標準配置。從財務票據錄入到銀企對賬,從訂單處理到社保申報,RPA通過腳本化執行替代人工操作,極大緩解了重複勞動壓力。 但當數字化進入深水區,企業逐漸發現:僅靠流程執行,並不能解決複雜業務問題。面對非

數據挖掘 , 機器人 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

超神經HyperAI - 【Triton 教程】層標準化

Triton 是一種用於並行編程的語言和編譯器。它旨在提供一個基於 Python 的編程環境,以高效編寫自定義 DNN 計算內核,並能夠在現代 GPU 硬件上以最大吞吐量運行。 更多 Triton 中文文檔可訪問 →https://triton.hyper.ai/ 在本教程中,你將編寫一個比 PyTorch 實現運行更快的高性能層標準化 (layer normalization) 內核。 在此過程

機器學習 , 自然語言處理 , 人工智能 , 編譯器 , 深度學習

收藏 評論

mob64ca12dc54c5 - windows ollama gpu運行

在高性能計算及機器學習模型的推理過程中,利用GPU加速是一項至關重要的技術。以“Windows Ollama GPU運行”為主題,我們將深入探討如何在Windows環境下成功部署和運行Ollama框架,以充分發揮GPU的計算潛力。 背景描述 當前的深度學習框架對計算資源的要求越來越高,尤其是在模型推理階段。GPU的並行計算能力讓其成為深度學習流程中不可或缺的部件。Ollama是一

機器學習 , 自然語言處理 , aigc , 深度學習

收藏 評論

上海拔俗網絡 - AI多智能體輿情繫統:數字世界的“千里眼”與“先知團”

打開手機是鋪天蓋地的信息,刷完社交平台又要翻新聞評論——傳統輿情分析就像在信息海洋裏“撈針”:要麼漏了關鍵聲音,要麼被海量無效信息淹沒,還總跟不上輿論發酵速度。而AI多智能體輿情分析系統,靠“分工協作”的技術邏輯,讓輿情分析變得精準、高效,還能提前預警風險。 其實“多智能體”一點不復雜,核心就是讓多個“AI小專家”各司其職、協同幹活,而非一個AI單打獨鬥。就像一支專業團隊,有采集員、

輿情分析 , ip , NLP , 自然語言處理 , 人工智能

收藏 評論

悲傷的斑馬 - 重構品牌“認知資產”:2026年GEO優化服務商前瞻與評估

Gartner預測,到2026年,超過30%的企業將把生成式AI作為其數字營銷戰略的核心組成部分。一個更為根本的變革在於:用户的決策鏈路不再始於十條藍色鏈接,而是始於AI直接生成的、結構化的答案摘要。品牌信息的戰場,已從“搜索結果頁”前移至大模型的“認知框架”中。 由此,生成式引擎優化(GEO) 爆發式增長,其核心目標是提升品牌在AI生成答案中的被引用概率、排名權重與信任度,實現“AI認知滲

資訊 , 自然語言處理 , 數據庫 , 人工智能

收藏 評論

Seal - 技術速覽|Meta Llama 2 下一代開源大型語言模型

AI 使用大型語言模型(LLM)來理解和生成自然語言。LLM 可以從大量文本中學習並創建有關各種主題的文本,並可以完成比如編寫代碼、生成歌詞、總結文章等任務。但有些 LLM 相關課程成本高昂且封閉,而現有的開放課程數量十分有限。這就是 Meta 推出新的開源 LLM Llama 2 的原因。 Meta Llama 2 旨在與 OpenAI 的 ChatGPT 和 Google Bard 等

自然語言處理 , chatgpt , openai , meta

收藏 評論

mob64ca14137e4f - WeTextProcessing:終極文本規範化與逆向文本規範化解決方案指南

WeTextProcessing 是一個功能強大的文本處理庫,專注於文本規範化的正向和逆向轉換。該項目由 wenet-e2e 團隊維護,提供高效且準確的文字轉化能力,特別擅長處理數字、日期時間等特殊文字的規範化和逆規範化操作。無論你是語音識別開發者、自然語言處理工程師,還是需要處理文本數據的普通用户,這個工具都能為你提供專業級的文本處理支持。 核心功能特性:

文本處理 , 自然語言處理 , text , 後端開發 , Python

收藏 評論

OpenBayes - UI-TARS-1.5 實現多模態 GUI 自主操作;FrontierScience 構建專家級科學推理評測數據集

公共資源速遞 5 個公共數據集: Arena-Write 寫作生成評測數據集 IF-Bench 紅外圖像理解基準數據集 Soul-Bench 音頻驅動人體動畫評測數據集 FrontierScience 推理科研任務評測數據集 VideoRewardBench 視頻獎勵模型評測數據集 4 個公共教程: UI-TARS-1.5 多模態 Agent GLM-ASR-Nano 智譜語音

機器學習 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

華明視訊科技 - 國內口碑較好的海關智能閘口系統品牌推薦,幫你做出明智的決策!

當海關物流效率直接影響企業競爭力,智能閘口系統的選擇便成了關鍵決策。面對市場上眾多的品牌和解決方案,如何找到真正可靠、高效的智能閘口系統?今天我們從行業實踐出發,為您梳理國內口碑較好的幾類選擇,助您做出明智決策。 穩定可靠型:老牌勁旅值得信賴 國內一批深耕海關智能化領域多年的企業,憑藉紮實的技術積累和豐富的項目經驗,在多個重要口岸實施了穩定運行的智能閘口系統。這些系統通常具備完善的硬件

圖像識別 , 神經網絡 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

OpenBayes - Depth-Anything-3 打開全視角空間感知;CytoData 還原細胞級顯微宇宙!

公共資源速遞 5 個公共數據集: Netflix 電影電視目錄數據集 CytoData 血液細胞圖像數據集 VERA 語音推理能力評測數據集 UNO-Bench 全模態評測基準數據集 EditReward-Bench 圖像編輯評測數據集 3 個公共教程: PixelReasoner-RL:像素級視覺推理模型 VibeThinker-1.5B:小模型也可以有大智慧 Depth-A

機器學習 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論

Aloudata大應科技 - 企業級智能問數四問:從“語義鴻溝”到“統一認知”

在數據分析領域,大模型的落地實踐正掀起一場變革風暴。“智能問數”被描繪為數據民主化的終極形態——業務人員無需依賴開發或分析師,僅憑自然語言即可獲得精準、可行動的數據洞察。這一願景極具誘惑力,也催生了大量技術投入。然而,在無數企業轟轟烈烈的實踐中,這條通往數據民主化的道路卻佈滿荊棘。本文將通過四個核心問題的探討,剖析企業級智能問數的真正內涵、核心挑戰、技術基石與成功實踐,揭示為何“語義編織”(Sem

自然語言處理 , 數據庫 , chatgpt , 人工智能

收藏 評論

上海拔俗網絡 - AI答辯實時分析系統:讓考核評價更客觀高效

在高校答辯、職場競聘答辯等場景中,“5名考官+1名答辯人”的模式很常見,但傳統人工評分總繞不開三個痛點:主觀偏好難規避、評分標準理解有偏差、答辯關鍵信息捕捉不全面。AI答辯實時分析系統,正是用技術打破這些瓶頸,讓答辯評價從“憑經驗、靠記憶”升級為“數據化、可追溯”。 這套系統的核心,是用三大技術鏈路實現“實時採集-智能分析-輔助決策”的閉環,技術不復雜但精準戳中需求。首先是多源數據實

數據 , NLP , 自然語言處理 , 人工智能 , 實用工具

收藏 評論

容智信息 - 什麼是Agentic AI?通俗解釋為什麼企業都在做智能體

如果你最近頻繁聽到一個詞——Agentic AI(自主式人工智能),但又隱約覺得它不像是“又一個AI概念”,那你的直覺是對的。 我先給一個結論式判斷: Agentic AI不是AI的新功能,而是企業用AI的“新方式”。 它標誌着AI正從“會回答問題”,升級為“能把事情做完”。 這也是為什麼,過去一年裏,幾乎所有頭部企業都在密集討論“智能體”。 很多人對AI的認知,仍停留

自動駕駛 , 機器人 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

容智信息 - Agent-100平台體驗報告:企業級智能體試用平台到底值不值得用?

在大量企業推進數字化、智能化的過程中,一個現實問題正在反覆出現:不是沒有AI工具,而是“能真正解決崗位問題的工具太少”。財務報銷審核依然堆積、盡職調查週期依然漫長、保險方案匹配仍靠人工經驗、市場分析離不開IT排期、客服與運營被重複性工單吞噬精力……這些問題並非企業不願投入,而是過去多數AI產品並未圍繞真實業務流程設計。在此背景下,我們對Agent-100智能體試用平台進行了系統化體驗與實測

自動駕駛 , 機器人 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

Aloudata大應科技 - 通往可信數據智能的路線圖,就在這本《NoETL to Trusted AI》白皮書

數據不好找、不敢用、用不對。 數據取不出、跑不動、要排期。 AI 生成的內容“好看”,但不一定“真實”。 在大模型席捲各行各業的今天,企業數據智能體(Data Agent)正成為新的“數字員工”。但如果沒有一套可信的數據基礎,再智能的 Agent 也難逃“數據迷宮”與“口徑陷阱”。 在昨天的推文中,Aloudata CEO 周衞林清晰闡釋了 Aloudata 在新時代的品牌定位:NoE

數據挖掘 , 自然語言處理 , 知識 , chatgpt , 人工智能

收藏 評論

索姆拉 - 阿里雲 - 全新升級!《雲原生架構白皮書 2022 版》重磅發佈 - 阿里巴巴雲原生

今天給大家分享的是一個白皮書,長達156頁,20w字,阿里的雲棲大會上發佈的,由40位一線工程師聯合撰寫。 叫做《AI原生應用架構白皮書》。 我看了看。 裏面有關AI的東西,是非常的全,我認為這是目前入門AI最好的一本書。 我們平時聽説過的熱詞,在這裏全都有詳細的解釋,甚至是來龍去脈,講得都非常透徹和真實。

llm , 大模型應用 , 自然語言處理 , 人工智能 , 數據結構與算法 , AI-native

收藏 評論

Lab4AI - 【項目復現上新】Karpathy開源GitHub高分項目NanoChat!僅用100美元+8000行代碼手搓ChatGPT

The best ChatGPT that $100 can buy. 10 月 13 日,AI 領域大神 AndrejKarpathy 發佈了自己的最新開源項目。截至當前,​GitHub 項目上已經達到 29.1KStar​。 nanochat 是什麼 nanochat 是 AI 領域專家 AndrejKarpathy 發佈的開源項目,該項目包含從數據準備、預訓練、中期訓練、監督微調(S

機器學習 , 圖像識別 , 自然語言處理 , 知識 , 深度學習

收藏 評論

合合技術團隊 - 【技術白皮書】第五章:信息抽取技術的未來發展趨勢和麪臨的挑戰

5.信息抽取技術的未來發展趨勢和麪臨的挑戰 5.1 NER技術的未來發展趨勢和麪臨的挑戰 論文《 Survey on Deep Learning for Named Entity Recognition》總結了NER技術面臨的挑戰和未來發展方向。隨着建模語言的進步和實際應用的需求,NER會得到研究人員更多的關注。另一方面,NER通常被視為下游應用程序的預處理組件。這意味着特定的NER任務

事件 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

mob64ca12ec8020 - 強行kill ollama 運行的模型

在使用Ollama工具運行模型的過程中,遇到“強行kill ollama 運行的模型”的情況時,這可能是由於系統資源的高消耗而導致模型無法正常工作。能力較強的模型在處理複雜請求時可能會佔用較高的CPU和內存資源,這使得在高負載環境下,強行結束進程成為一種應急措施。針對這一問題,本文將對其進行全面分析及提供相應的解決方案,並通過多個結構化的維度進行解讀。 背景定位 技術定位 O

高併發 , 自然語言處理 , aigc , 深度學習

收藏 評論

OpenBayes - VibeVoice-Realtime TTS重構實時語音體驗;覆蓋9大真實場景,WenetSpeech-Chuan讓模型聽懂川話

公共資源速遞 5 個公共數據集: VOccl3D 三維人體遮擋視頻數據集 Spatial-SSRL-81k 空間感知自監督數據集 WenetSpeech-Chuan 川渝方言語音數據集 MMSVGBench 多模態矢量圖生成基準數據集 Fungi MultiClass Microscopic 真菌顯微圖像數據集 6 個公共教程: 基於手勢識別的 3D 聖誕樹 Dia2-TTS:

機器學習 , 算法 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

OpenBayes - 教程上新丨美團開源視頻生成模型LongCat-Video,兼具文生視頻/圖生視頻/視頻續寫三大能力,媲美開閉源頂尖模型

世界模型旨在理解、模擬與預測複雜的現實世界環境,是人工智能在真實場景中實現有效應用的重要基礎。在這一框架中,視頻生成模型通過其生成過程,逐步壓縮並學習幾何、語義、物理等多種知識形態,因而被視為構建世界模型的一條關鍵路徑,並有望最終實現對真實物理世界動態的有效模擬與預測。 而在視頻生成領域,實現高效的長視頻生成能力尤為重要。 基於此,美團開源了最新視頻生成模型 LongCat-Video,該模型旨在

機器學習 , 自然語言處理 , 教程 , 人工智能 , 深度學習

收藏 評論