這個是網上目前可能唯一一個使用不足一百行代碼實現了複雜車輛速度估計+距離測量+軌跡跟蹤+區域進出統計系統。之所以這麼簡單是因為ultralytics模塊現在已經成熟而且強大,不需要從頭開始寫車輛速度估計、距離測量、軌跡跟蹤、區域進出統計系統代碼,因為裏面邏輯比想象要複雜不少,不是有經驗程序員無法短時間從邏輯代碼解放出來。因此代碼對小白十分友好,而且我們只需要關注功能結果本身不必注
Dify支持語音識別,但是前提是需要本地部署音頻識別模型並開放對應的API接口。這裏把該過程進行記錄,方便後續進行回溯。 一、語音識別模型部署 在github上找到了一個funasr-api的項目,能夠很好的完成語音模型加載,並提供API接口,就不需要再自己去開發接口了。 Github地址如下: https://github.com/Quantatirsk
當你走進一家咖啡館,看到一個朋友面前放着半杯咖啡。 經典統計學家可能會説:根據歷史數據,80%的人在這裏點美式咖啡。 而貝葉斯主義者:讓我用新證據更新一下我的信念,既然杯子只有半滿,説明他可能剛來不久,而且眉頭微皺,可能咖啡不太合口味... 貝葉斯定理的數學表達式: 翻譯成人話就是:新證據出現後,我對某個假設的信念需要更新。其中P(A)是先驗概率(原來的信
你有沒有遇到過這些場景?看到一個精彩視頻,想把文案提取出來做筆記。會議或教程視頻太長,想轉成文字快速整理。 邊聽視頻邊打字,效率太低。 下面介紹7種工具,能夠把本地視頻、在線視頻轉成文字,覆蓋主流的在線視頻平台。 第一部分:視頻號等在線內容平台 視頻號用元寶,把元寶加為微信列表好友,順手把視頻轉發給元寶,要求提取完整文案,就可以自動識別出文案。
在當前LLM(大型語言模型)的應用浪潮中,檢索增強生成(RAG)已成為相對成熟且應用最廣的落地模式之一。但無論是從最初的Naive RAG演進到Advanced RAG,還是最新的Agentic RAG,其核心都離不開一個關鍵底座:知識庫管理系統。 對於面向落地應用RAG的產品經理和工程化技術人員而言,如果只是停留在對LLM能力或RAG流程的表面理解,很難在真實複雜的業務場
在深度學習領域,卷積神經網絡(CNN)已成為圖像識別任務的首選架構。而在CNN訓練過程中,優化器的選擇對模型性能有着至關重要的影響。本文將深入探討多種優化算法的原理,並通過手寫數字識別任務對比它們的實際表現。 優化器原理詳解 1. 隨機梯度下降(SGD) 隨機梯度下降是最基礎的優化算法,其更新公式為: 其中$η$是學習率,$∇J(θ
LangChain是一個專為大語言模型設計的開放框架,圍繞任務鏈(Chain)與內存模塊(Memory)構建了核心架構。這兩大組件是LangChain高效構建複雜語言應用的關鍵所在,使模型在多任務環境中得以應對任務管理、上下文維護、記憶存儲等多種需求。 構建大模型智能應用的時候,往往需要對數據庫進行查詢,返回結果,如果自己寫MCP客户端和Tools工具比較麻煩。如果基於La
0. 模型訓練小知識 自從深度學習火了以後,大家就把傳統視覺算法看低了。 因為模型的訓練需要GPU或者CPU飛速運轉好久才能完成,而訓練出來的模型又每次都非常意外,所以大家又把模型訓練戲稱為煉丹,真是充滿了玄學意味。 深度學習時代,什麼最重要?數據!像我們這次的任務,需要準備100~500張圖片,確保包含不同角度、光照和模糊程度。如果想做的很好,業界推薦是幾千張
知識庫檢索總是答非所問?複雜查詢根本搞不定?模型微調成本又太高? 如果你也被這些問題困擾,今天這篇文章可能會給你一個全新的思路——MCP + 數據庫,一種讓AI精準檢索結構化數據的"黑科技"。實測效果吊打傳統RAG,而且幾乎零代碼! RAG的"中年危機" 我們以為的RAG vs 現實中的RAG 説起RAG(檢索增強生成),很多人覺得這是給大模型"接外掛"的
卷積神經網絡算法(CNN)是一種專門用來處理具有網格結構數據(如圖像、視頻、時間序列等)的深度神經網絡。 它通過模仿人類視覺皮層的工作機制,通過局部感受野、權重共享和池化等設計,極大地降低了模型的複雜度,並有效提取了數據的空間層次特徵。 卷積神經網絡算法在計算機視覺領域,如圖像識別、目標檢測、圖像分割中取得了巨大成功。 核心原理
隨着工業自動化和物聯網技術的迅猛發展,SCADA(監控與數據採集系統)和 HMI(人機界面)已成為現代化工業體系中的重要組成部分。然而,傳統的 SCADA 和 HMI 工具往往受限於封閉的架構和複雜的部署流程,難以滿足當前工業 4.0 對開放性、靈活性和跨平台支持的要求。 FUXA是一款基於Web的SCADA/HMI工業過程可視化開源組態軟件,通過
本文主要分享技術架構、數據架構、業務架構、應用架構、產品架構和項目架構的定義和主要區別與聯繫。 1. 業務架構 業務架構關注的是組織的業務戰略、流程、能力和治理結構。它描述了企業“做什麼”以及“為什麼做”。 核心內容:包括企業的商業模式、戰略目標、關鍵業務流程(如訂單處理、客户服務)、組織結構和核心業務能力。 目
代碼實現多模型校準性能對比分析,原理為通過 LSTM/BiLSTM 捕捉時序特徵,傳統機器學習模型擬合數據分佈,利用 calibration_curve 評估模型預測概率與實際正例比例的一致性。實現方法為加載 / 生成標準化數據,訓練 / 加載 LSTM、BiLSTM、隨機森林等多類模型,生成預測概率後繪製校準曲線,量化對比不同模型的校準效果,為模型選擇與優化提供實驗依據。
在處理兼具局部相關性與長期依賴性的複雜時序數據時,CNN-LSTM是個非常可靠和有效的選擇。因為它通過分工協作有效解決了關鍵矛盾,這方面比單一模型更全面、更穩健。 但從創新角度來説,CNN-LSTM做時序預測研究範式已經發生了深刻變化,單純堆疊的思路是很難再登上頂會頂刊了。現在的主流更偏向於深度集成與改造,或與Transformer等新架構進行復雜融合,這方面已有不少成果出
計算機視覺技術是指利用相機與電腦連接成的一個系統,通過對目標的檢測、追蹤、測量和進一步的預處理得到能夠代表圖像特徵的信息,再對這些特徵信息通過計算機算法進行識別[1-2]。在選煤行業,隨着選煤廠智能化水平的提高,對各個生產崗位的要求也更加嚴格,同樣浮選車間的控制也要求精煤灰分儘可能穩定[3]。前人在浮選泡沫圖像的識別問題上已經做了大量的研究,例如,Kaartinen[4]在鋅粗選
一般來説,時間序列像一條由兩部分組成的河流:一部分是“平穩、能用直線或簡單公式描述”的水流(線性成分),另一部分是“突然的涌動、彎曲和複雜模式”(非線性成分)。 ARIMA 擅長抓住那部分可以用線性自迴歸/移動平均解釋的“規矩”水流;隨機森林擅長從複雜、非線性的關係裏找模式。 把兩者“融合”起來,就是先用 ARIMA 把序列裏能用線性解釋的部分拿掉(得到殘差),再讓
今天用Dify來搭建一個企業級的知識庫 目錄 為避免浪費時間。提供文章導讀,為讀者看清楚今天聊的話題能解決哪些問題。 知識庫 什麼是知識庫? 很多人以為知識庫就是一個放文檔的地方,類似Wiki。其實不只這麼簡單。 知識庫在AI工程化語境下,是一個結構化、可檢索、可推理的數據系統,主要功能: 存儲企業內部的文檔、代碼、對話
當下,單個大模型已經強得驚人,但許多人也開始意識到一個現實:再強的“超級大腦”,在面對開放式、路徑未知、需要多方向試探的任務時,依然會有侷限。就像一個全能員工再厲害,也不一定能單挑一個完整的創業項目。 這也是多智能體系統近期被反覆討論的原因。它不是簡單地“把多個模型拼在一起”,而是通過分工、協作、競爭和組織方式,讓 AI 之間形成真正的團隊關係,從而應對那些單一模型難以駕馭
AIoT物聯網平台是一個Go語言開發的通用、開源的企業級物聯網應用平台,旨在通過可複用的組件,減少開發工作,加速物聯網項目交付。可廣泛應用於交通、醫療、消費、家居、消防、安防、工業、農業等各個領域。 插件化是最大的特點,通過插件配置您不用編寫代碼,可以快速構建應用,並將業務打包分發給世界各地的用户,使物聯網應用開發的複雜性大大降低。業務交付時間相比
LSTM與圖卷積網絡結合的社交網絡行為預測。 GCN像朋友圈加權平均器,把每個人在當前時刻的狀態,和TA朋友圈(圖的鄰居)的狀態融合起來,得到一個考慮社會影響的時刻表徵。 LSTM像記憶管家,把過去一段時間(多個時刻)的融合表徵傳進記憶單元,學最近是火了還是冷了,有沒有周期性等時間規律。 合體後,相當於先看社交圈,再看時間史,預測下一刻的行為,是不是很酷!~
一 買地皮(搞個域名 + 免費白嫖 Cloudflare) 想搞永久建築,先得有塊地。很多兄弟卡在第一步,覺得買域名很難,其實就跟充話費一樣簡單。 1.花 20 塊錢買個域名去騰訊雲、阿里雲或者國外的 Namecheap。省錢技巧:別買死貴的 .com(一年 70 多),買個便宜的 .top、.xyz 或者 .online,一年也就 20-30 塊錢。 2
今天咱們和大家一起聊聊關於 XGBoost 的一個算法案例:XGBoost 在股市波動預測中的應用。 當然,僅僅作為算法模型的學習,切勿用於真實情況。 下面,咱們從原理到案例,好好説説~ XGBoost原理 XGBoost(eXtremeGradient Boosting)是一個基於梯度提升決策樹(GBDT)實現的高效分佈式機器學
咱們今天來聊聊融合Transformer+LSTM+CNN,這也是有一位同學提到的。 核心點:用卷積抓短期、用 LSTM 維護狀態、用自注意力抓任意距離的依賴。 首先,咱們來看看這三位“同學”各自擅長的點在哪裏? CNN(卷積):擅長抓“局部模式”,像短期的波峯/波谷、週期裏的固定形狀。 LSTM(長短時記憶網絡):擅長記住“時間上的因果和長期依賴”,把過
如果把過去幾年的大語言模型(LLM)浪潮比作“電力被髮明”的階段,那麼 AI Agent 更像是“電氣化工廠”的開始:電不再只是點燈,而是接入生產線、帶動機器、形成一整套自動化體系。 從 AGI 分級的角度看,AI Agent 通常被視為 L3 級智能體: 不再只是“回答問題的工具”,而是具備明確目標、可持續運行、能主動決策和執行任務的智能實體。 技