tag 計算機視覺

標籤
貢獻100
170
07:11 AM · Nov 05 ,2025

@計算機視覺 / 博客 RSS 訂閱

智能開發先鋒 - imatest 解析度測試中圖像亮度越高值越大

分辨率(解析度,Resolution) 分辨率使我們經常聽到的一個詞,它代表了圖像的精細程度,也代表了圖像的大小。分辨率決定了在這種大小下,輸出信號是否能夠包含足夠多的信息來獲取所需的細節。這個參數和圖片本身是否鋭利或圖片是否沒有干擾(比如彩色摩爾紋)關係不大。 在ISO 12233中,分辨率被定義為衡量一個攝像機系統或攝像機系統的一

圖像處理 , 其他 , 傳遞函數 , 架構 , 後端開發 , 計算機視覺 , isp

收藏 評論

mob64ca13f937ae - vfp中四捨五入取整函數

C# 中沒有四捨五入函數,程序語言都沒有四捨五入函數,因為四捨五入算法不科學,國際通行的是 Banker 舍入法 Bankers rounding(銀行家舍入)算法,即四捨六入五取偶。事實上這也是 IEEE 規定的舍入標準。因此所有符合 IEEE 標準的語言都應該是採用這一算法的 Math.Round 方法默認的也是 Ban

Math , vfp中四捨五入取整函數 , 人工智能 , 計算機視覺 , MSDN , 四捨五入

收藏 評論

mob64ca14163a4f - avfilter_graph_create_filter報錯

PWM 兩位數碼管的驅動方式是動態掃描,每一位都只有50%的時間是亮的,我們稱這個數值為其佔空比。讓引腳輸出高電平點亮LED,佔空比就是100%。 在驅動數碼管時,我們迫不得已使佔空比為50%,因為不能讓兩位真正同時地顯示不同的數字。但是,我們也可以有意地讓LED的佔空比不到100%,以降低其亮度。 佔空比是可以用程序來調節的。

include , 引腳 , 人工智能 , 寄存器 , 計算機視覺

收藏 評論

AI數字人研究社 - 中國數字人企業推薦:2025數字人產業核心廠商與權威排名與市場趨勢深度報告

虛實融合,數字人開啓智能交互新紀元 隨着人工智能、圖形渲染與大數據技術的深度融合,AI數字人已從概念演示快速演進為驅動產業數字化與社會服務智能化變革的關鍵力量。它不再是簡單的動畫形象,而是集成了自然語言理解、語音交互、情感計算與高保真可視化等多模態能力的智能交互體,旨在以擬人化的方式,無時空限制地提供信息、服務與陪伴。據權威市場分析機構預測,2025年中國數字人市場將進入規

智能硬件 , 交互設計 , 數字人 , 人工智能 , 計算機視覺 , 大模型

收藏 評論

美狐美顏SDK開放平台 - 什麼是美顏sdk?直播平台美顏功能開發全流程詳解

近幾年,直播行業的更新速度簡直和GPU一樣快——上一秒還在卷清晰度,下一秒就開始卷“顏值體驗”。無論是電商主播、普通陪聊直播,還是短視頻平台的實時拍攝,都離不開“美顏sdk”。很多開發者初次接觸時,會疑惑:美顏sdk本質上是什麼?它到底是怎麼幫直播平台完成實時磨皮、瘦臉、濾鏡等效果的?一個完整的美顏功能開發流程又長什麼樣? 這篇文章就來給你一次性講清楚,讓你既能理解底層邏輯

視頻美顏sdk , 美顏api , 人工智能 , 直播美顏sdk , 計算機視覺 , 第三方美顏SDK , 在51CTO的第一篇博文 , 美顏SDK

收藏 評論

編程夢想家 - 實時實例分割最新

本文主要解決視頻目標分割領域的一個基本問題:如何使分割模型能夠有效地適應特定視頻以及在線目標的外觀變化。 解決辦法:提出一個圖存儲網絡來對分割模型進行“學習更新”。 大概流程分為兩步:首先構建一個由全連接圖構成的情景存儲網絡,將幀存儲為節點,並通過邊捕獲跨幀的相關性。然後,可學習的控制器被嵌入以簡化內存的讀寫。 相比於以往模型的優勢:結構化的外部

機器學習 , 實時實例分割最新 , 神經網絡 , 人工智能 , 深度學習 , 計算機視覺

收藏 評論

風之谷啓航 - 動態路由 語義分割

知識點一: 路由選路是根據路由表來實現的。 知識點二: 路由表必須包括下面五項內容: 前綴---- || 指出是為哪個網絡所服務 掩碼---- 下一跳:指出出接口是哪一個 管理距離(AD):範圍0-255 度

鏈路 , 人工智能 , 計算機視覺 , 動態路由 語義分割 , 路由協議 , 路由表

收藏 評論

美狐美顏SDK開放平台 - 企業級直播美顏SDK開發指南:特效功能這樣做更穩定

在直播、視頻化成為“基礎設施”的今天,美顏早已不只是“錦上添花”,而是決定用户是否留下來的第一體驗。 無論是直播帶貨、在線教育、醫療問診,還是企業會議、社交娛樂,只要涉及實時視頻,美顏與特效能力幾乎都是標配。但很多團隊在真正落地時才發現:能跑demo≠能商用,能用≠穩定可擴展。 本文將從企業級實戰視角,聊一聊直播美顏SDK在特效功能開發中,如何兼顧效果、性能與穩定性,

視頻美顏sdk , 美顏api , 人工智能 , 直播美顏sdk , 計算機視覺 , 第三方美顏SDK , 在51CTO的第一篇博文 , 美顏SDK

收藏 評論

mob64ca1404ed65 - Tensorrt踩坑日記 | python、pytorch 轉 onnx 推理加速

環境補充 配置訓練環境時,有一些包沒有安裝,這裏進行一些補充,就記得這幾個了,其餘的忘了,大家缺啥補啥吧,反正都是pip安裝。 conda activate rf-detr pip install onnx pip install onnxruntime pip install onnxsim onnx模型導出 from

人工智能 , 深度學習 , 計算機視覺 , 目標檢測 , 前端開發 , Javascript , Python

收藏 評論

IT劍客風雲 - AVFrame 音頻幀數據的大小

錄製 視頻 過程中,視頻幀率視頻設置幀率為25, 而此時 從採集設備過來的 數據流也是25frame/s ,如是 我十分好奇音頻有沒有類似幀率一説, 百度到如下資料:感覺十分 清楚的説明了 該問題: 採樣率Sample Rate指單位時間內對媒體對象的採樣次數,單位Hz(這句話好像和原來不太一樣,鬱悶)。

音視頻 , 幀率 , 採樣率 , AVFrame 音頻幀數據的大小 , 人工智能 , 計算機視覺

收藏 評論

deanyuancn - OpenCV 使用ROI進行圖像切割

文章目錄 思維導圖 前言 一、ROI切割核心概念 1.1 ROI的定義 1.2 OpenCV中的圖像存儲機制 1.2.1 圖像的數組表示 1.2.2 座標系統規則 1.2.3 顏色通道順序 1.3 ROI切割的實現原理

數組 , 人工智能 , 計算機視覺 , opencv , 前端開發 , Javascript

收藏 評論

mob64ca13f87273 - 機器人視覺識別系統研究_fpga和matlab的技術博客

摘要 工業生產過程中,儀表作為關鍵設備運行狀態的核心監測載體,其數據的精準、實時採集對安全生產與高效運維至關重要。傳統人工巡檢模式存在效率低下、環境適應性差、人為誤差等弊端,難以滿足現代化工業的智能化管理需求。工業巡檢機器人結合視覺識別技術,實現了儀表數據的自動化、無人化採集,成為工業智能化轉型的重要支撐。本文系統闡述視覺識別技術在工業巡檢

機器學習 , 機器人 , 人工智能 , 計算機視覺 , Css , 目標檢測 , 前端開發 , HTML

收藏 評論

圍爐聊科技 - 從像素到語義:圖像分割技術的演進與實踐

打開手機的人像模式拍攝照片,背景被自然虛化;醫院裏,CT影像中的腫瘤區域被精準標記;自動駕駛汽車實時識別道路、行人與障礙物——這些場景背後,都離不開計算機視覺領域的核心技術:圖像分割。作為連接"圖像感知"與"語義理解"的關鍵橋樑,圖像分割實現了從"看到像素"到"看懂內容"的跨越,其技術演進更是人工智能發展的生動縮影。本文將帶你全面梳理圖像分割技術的發展脈絡,解析核心算法原理,並探

圖像分割 , 人工智能 , 計算機視覺

收藏 評論

archangle - segment anything 實例分割 cpu

CAD圖形分割操作步驟: 步驟一,首先打開浩辰CAD建築軟件,進入軟件界面,然後打開需要調整的圖紙,下面小編以一張CAD建築圖紙來演示。 步驟二,我們放大圖紙,選中需要切割的圖塊。在菜單位置,找到【建築設計】—【符號標註】—【加折斷線】命令。 步驟三,在彈出的命令行提示:請選擇一剖切線。在首層平面圖上選擇一根已繪製好的剖面線。此時,程序

命令行 , 數據 , 人工智能 , 計算機視覺

收藏 評論

代碼匠人之心 - VFP 鎖定 字段 FREEZE

一、Autolayout的對齊與等寬 1.對其 兩個控件都沒有描述清楚,以先創建的控件為準。 兩個控件有一個描述清楚,以描述清楚的控件為準。 2.等寬 兩個控件都沒有描述清楚,以控件的默認的為準。 兩個控件有一個描述清楚,以描述清楚的控件為主。 二、VFL(VisualFormatLanguage) 1.是

控件 , VFP 鎖定 字段 FREEZE , 屬性值 , 動畫效果 , 人工智能 , 計算機視覺

收藏 評論

IT智行領袖 - bevformer簡單復現

©作者|杜偉、陳萍 微軟亞洲研究院升級了 Swin Transformer,新版本具有 30 億個參數,可以訓練分辨率高達 1,536×1,536 的圖像,並在四個具有代表性的基準上刷新紀錄。 在不久之前公佈的 ICCV 2021 論文獎項中,來自微軟亞洲研究院的研究者憑藉論文《Swin Transformer: Hierarchic

機器學習 , bevformer簡單復現 , 人工智能 , 深度學習 , 計算機視覺

收藏 評論

陌陌香閣 - 圖像顯著目標檢測模型

和昨天的那篇U²Net同作者,但是更早一點。 大多數深度學習方法→在顯著性預測時側重於區域預測→但現在他們創建了一個新的損失函數→也考慮了目標的邊界。 顯著性預測→我們人類擅長於此→關注給定的圖像或視頻中的“重要”目標。(但沒有很多方法考慮目標的邊界)。現在有很多深度學習模型結合了不同的表示方式。

code , 圖像顯著目標檢測模型 , 損失函數 , 人工智能 , 深度學習 , 計算機視覺

收藏 評論

mob64ca1405d568 - HAO 人 物體 動作預測 計算機視覺任務

作者|VVingerfly 3D人體姿態和形狀估計在最近幾年是一個重要的研究熱點,但大部分工作僅僅關注人體部分,忽略了手部動作,港中文聯合Facebook AI研究院提出了一種從單張圖片同時估計人體姿態和手部動作的新方法,展示效果好似科學怪物。 如下圖左下和右下所示,易看出本文提出的方法姿態估計效果更好。

機器學習 , 神經網絡 , 人工智能 , 深度學習 , 計算機視覺

收藏 評論

美狐美顏SDK開放平台 - 輕量級直播美顏SDK的構建策略:端側推理、模型壓縮與算力調度

在短視頻和直播時代,用户對視頻畫質和美顏效果的要求越來越高。然而,對於直播平台和應用開發者來説,實現高質量美顏同時保持流暢的實時體驗,卻並非易事。今天,我們從軟件開發的角度,探討如何構建一個輕量級直播美顏SDK,並重點關注端側推理、模型壓縮和算力調度三大關鍵策略。 一、為什麼選擇輕量級SDK? 在直播場景中,用户的設備多樣,從高性能旗艦手機到低端機型都有。這就

視頻美顏sdk , 美狐美顏sdk , 人工智能 , 直播美顏sdk , 計算機視覺 , 在51CTO的第一篇博文 , 美顏SDK

收藏 評論

碼海無壓 - Android攝像頭預覽黑白

一、工業相機選型 1、黑白/彩色 黑白的同樣分辨率的相機,精度比彩色高,尤其是在看圖像邊緣的時候,黑白的效果更好。特別是做圖像處理,黑白工業相機得到的是灰度信息,可直接處理。 要想得到與現實吻合度高的色彩,需要後期處理,比如監控相機。 2、面陣相機/線陣相機 如果對於檢測精度要求很高,運動速度很快,面陣相機的分辨率和幀率達不

移動開發 , 工業相機 , Android攝像頭預覽黑白 , Android , 人工智能 , 深度學習 , 計算機視覺

收藏 評論

mob64ca14116c53 - ffmepg濾鏡subtitles傳入AVFrame崩潰

1、AVFilter簡介 FFmpeg中的AVFilter模塊進行幀數據處理的開發,AVFilter模塊對幀數據處理進行了很好的抽象,對其中的幀數據處理(包括音頻和視頻數據)則相對要多樣化一些,比如對視頻做尺寸變換,進行音頻音量均衡,直播中的美顏處理,多路流合成等等,這些都是屬於流程中的幀數據處理。 一般的編解碼流程就是;

視頻分割剪切翻轉疊加 , 濾鏡 , 人工智能 , 視頻水印添加 , avfilter實踐 , avfilter+sdl , 計算機視覺

收藏 評論

mob64ca13fbd761 - 街道車輛目標檢測公開數據集 車輛目標檢測的意義

車輛是視頻場景中最關鍵的對象之一,車輛 和 人 是視頻檢測永恆的話題。 車輛檢測是車輛分析中關鍵的一步,是後續進行車型識別、車標識別、車牌識別、車輛特徵 關於檢測的方法和框架有很多,不外乎是特徵訓練和分類,這裏推薦兩篇綜述性文章: [1] Benenson R, Omran M, Hosang

數據集 , 行人檢測 , 人工智能 , 計算機視覺 , 街道車輛目標檢測公開數據集 , 下載地址

收藏 評論

mob64ca140fd7c1 - 多光譜遙感目標檢測數據集

1.資源一號02C衞星 資源一號02C星(ZY1-02C)於2011年12月22日成功發射,牽頭主用户為自然資源部。ZY1-02C星搭載有全色多光譜相機和全色高分辨率相機,主要任務是獲取全色和多光譜圖像數據,可廣泛應用於自然資源調查與監測、防災減災、農林水利、生態環境、國家重大工程等領域。 ZY1-02C星具有兩個顯著特點:一是配置的10米分

圖像處理 , 數據 , 數據倉庫 , 人工智能 , 多光譜遙感目標檢測數據集 , 計算機視覺

收藏 評論