tag 數據集

標籤
貢獻81
202
11:04 PM · Nov 06 ,2025

@數據集 / 博客 RSS 訂閱

mb686fbcc4efbd6 - 流動攤販佔道經營街上擺攤檢測數據集VOC+YOLO格式1396張3類別

注意數據集人臉經過脱敏處理,全部遮擋 數據集格式:Pascal VOC格式+YOLO格式(不包含分割路徑的txt文件,僅僅包含jpg圖片以及對應的VOC格式xml文件和yolo格式txt文件) 圖片數量(jpg文件個數):1396 標註數量(xml文件個數):1396 標註數量(txt文件個數):1396 標註類別數:3 所在倉庫:firc-d

數據集 , 後端開發 , JAVA , txt文件 , xml文件

收藏 評論

技術博客達人 - 標書中的索引表怎麼做

分節表視圖 簡單的表視圖僅僅有一個節,它實際上是分節表視圖的一個特例。一個表能夠有多個節,節也有頭有腳,分節是加入索引和分組的前提。 索引的正確使用原則如所看到的: 1、索引標題不能與顯示的標題全然一樣。假設與要顯示的標題一致,索引就變得毫無意義。 2、索引標題應具有代表性。能代表一個數據集合。 3、假設採用

數據集 , 大數據 , 數據倉庫 , 標書中的索引表怎麼做 , 下拉列表 , 表視圖

收藏 評論

mob64ca14137e4f - OpenAI的子詞標記化神器--tiktoken 以及 .NET 支持庫SharpToken-

第一章:數據預處理與分詞 想象你是一位廚師,目標是烤制美味的蛋糕。 不能直接把生雞蛋、麪粉和糖扔進烤箱。首先需要準備食材:打散雞蛋、稱量麪粉、甚至過篩去除結塊。 這些準備工作確保食材以正確的形態和比例進入烘焙流程。 在GPT這類大語言模型(LLM)的世界裏,情況非常相似 我們的"廚師"是GPT模型,"食材"則是海量的人類書寫

數據集 , 數據 , 加載 , gpt , 後端開發 , Python

收藏 評論

u_15851118 - ASR項目介紹

語音轉文本ASR工具合集彙總過幾個ASR項目或模型,本文繼續彙總,並做簡單介紹和部分初步實戰。 注:缺乏深入實戰,和問題記錄,請勿噴。 Omnilingual ASR 論文,項目首頁,Meta開源(GitHub,2.4K Star,207 Fork),支持1600種語言,其中超過500種語言是首次被任何ASR系統覆蓋。 ASR系統

數據集 , 數據 , Css , 官網 , ASR , 前端開發 , HTML

收藏 評論

mb686fbcc4efbd6 - 甲骨文文字檢測數據集VOC+YOLO格式6079張1類別

數據集格式:Pascal VOC格式+YOLO格式(不包含分割路徑的txt文件,僅僅包含jpg圖片以及對應的VOC格式xml文件和yolo格式txt文件) 圖片數量(jpg文件個數):6079 標註數量(xml文件個數):6079 標註數量(txt文件個數):6079 標註類別數:1 所在github倉庫:firc-dataset 標註類別名稱

oracle , 數據集 , 後端開發 , txt文件 , Python

收藏 評論

王校長的熱狗 - 房屋坍塌檢測數據集1972張VOC+YOLO格式

房屋坍塌檢測數據集1972張VOC+YOLO格式 數據集格式:VOC格式+YOLO格式 壓縮包內含:3個文件夾,分別存儲圖片、xml、txt文件 JPEGImages文件夾中jpg圖片總計:1972 Annotations文件夾中xml文件總計:1972 labels文件夾中txt文件總計:1972 標籤種類數:3 標籤名稱:["Glob

數據集 , 標籤名 , 後端開發 , txt文件 , 房屋坍塌檢測數據集 , Python

收藏 評論

mob64ca13fe9c58 - 大模型入門(六)—— RLHF微調大模型

先安裝好python3.9和torch2.7.0 然後裝diffusers git clone https://github.com/huggingface/diffusers cd diffusers pip install -e . 然後cd進入examples/text_to_image,裝其他包: cd examples

環境變量 , 數據集 , 下載文件 , 後端開發 , Python

收藏 評論

mob64ca13fdd43c - [源碼分析] Facebook如何訓練超大模型 --- (2) -

文章目錄 實戰量化Facebook OPT模型 Facebook OPT模型介紹 auto-gptq方式量化 1、定義量化配置 2、加載模型量化 3、檢查量化正確性 4、保存量化後的模型權重 5、使用量化模型進行文本生成 6、使用自定義的數據集

數據集 , 語言模型 , 加載 , 人工智能 , Css , 前端開發 , 量化 , HTML

收藏 評論

mb686fbcc4efbd6 - 無人機視角航拍巡檢河道識別分割數據集labelme格式646張1類別

數據集格式:labelme格式(不包含mask文件,僅僅包含jpg圖片和對應的json文件) 圖片數量(jpg文件個數):646 標註數量(json文件個數):646 標註類別數:1 標註類別名稱:["river"] 每個類別標註的框數: river count = 938 總框數:938 使用標註工具:labelme=5.5.0

數據集 , json數據 , 後端開發 , JAVA , Json

收藏 評論

mb686fbcc4efbd6 - 癌症檢測血細胞識別分割數據集labelme格式4918張5類別

數據集格式:labelme格式(不包含mask文件,僅僅包含jpg圖片和對應的json文件) 圖片數量(jpg文件個數):4918 標註數量(json文件個數):4918 標註類別數:5 標註類別名稱:["Basophil","Erythroblast","Monocyte","Myeloblast","Seg_Neutrophil"]=["嗜鹼性粒細胞"

數據集 , json數據 , 後端開發 , JAVA , Json

收藏 評論

mb686fbcc4efbd6 - 智慧城市道路路面垃圾檢測數據集VOC+YOLO格式3321張17類別

數據集格式:Pascal VOC格式+YOLO格式(不包含分割路徑的txt文件,僅僅包含jpg圖片以及對應的VOC格式xml文件和yolo格式txt文件) 圖片數量(jpg文件個數):3321 標註數量(xml文件個數):3321 標註數量(txt文件個數):3321 標註類別數:17 所在倉庫:firc-dataset 標註類別名稱(注意yo

數據集 , 後端開發 , JAVA , txt文件 , xml文件

收藏 評論

王校長的熱狗 - 車輛佔用應急車道檢測數據集577張VOC+YOLO格式

車輛佔用應急車道檢測數據集577張VOC+YOLO格式 數據集格式:VOC格式+YOLO格式 壓縮包內含:3個文件夾,分別存儲圖片、xml、txt文件 JPEGImages文件夾中jpg圖片總計:577 Annotations文件夾中xml文件總計:577 labels文件夾中

數據集 , 佔用應急車道檢測數據集 , 標籤名 , 後端開發 , txt文件 , Python

收藏 評論

王校長的熱狗 - 排水管道缺陷數據集4767張VOC_YOLO(已增強)

排水管道缺陷數據集4767張VOC_YOLO(已增強) 數據集格式:VOC格式+YOLO格式 壓縮包內含:3個文件夾,分別存儲圖片、xml、txt文件 JPEGImages文件夾中jpg圖片總計:4767 Annotations文件夾中xml文件總計:4767 labels文件夾中txt文件總計:4767 標籤種類數:5 標籤名稱:["C

排水管道缺陷數據集 , 數據集 , 後端開發 , txt文件 , CL , Python

收藏 評論

mb686fbcc4efbd6 - 無人機視角森林倒樹識別分割數據集labelme格式5018張2類別

數據集格式:labelme格式(不包含mask文件,僅僅包含jpg圖片和對應的json文件) 圖片數量(jpg文件個數):5018 標註數量(json文件個數):5018 標註類別數:2 標註類別名稱:["roots","treefall"] 每個類別標註的框數: roots(樹根) count = 11988 treefall(倒樹)

數據集 , 無人機 , 後端開發 , JAVA , Json

收藏 評論

王校長的熱狗 - 道路油漆檢測數據集687張VOC+YOLO格式

道路油漆檢測數據集687張VOC+YOLO格式 數據集格式:VOC格式+YOLO格式 壓縮包內含:3個文件夾,分別存儲圖片、xml、txt文件 JPEGImages文件夾中jpg圖片總計:687 Annotations文件夾中xml文件總計:687 labels文件夾中txt文件總計:687 標籤種類數:1 標籤名稱:["paint"]

數據集 , 標籤名 , 後端開發 , 道路油漆檢測數據集 , txt文件 , Python

收藏 評論

mb686fbcc4efbd6 - 輪椅枴杖檢測數據集VOC+YOLO格式8995張2類別

數據集格式:Pascal VOC格式+YOLO格式(不包含分割路徑的txt文件,僅僅包含jpg圖片以及對應的VOC格式xml文件和yolo格式txt文件) 圖片數量(jpg文件個數):8995 標註數量(xml文件個數):8995 標註數量(txt文件個數):8995 標註類別數:2 所在倉庫:firc-dataset 標註類別名稱(注意yol

數據集 , 後端開發 , JAVA , txt文件 , xml文件

收藏 評論

DeepSeaAI - 項目實戰:LLaMaFactory和Qwen2-VL-2B微調大模型實戰

簡介 本文介紹了一個基於多模態大模型的醫療圖像診斷項目。項目旨在通過訓練一個醫療領域的多模態大模型,提高醫生處理醫學圖像的效率,輔助診斷和治療。作者以家中老人的腦部CT為例,展示瞭如何利用MedTrinity-25M數據集訓練模型,經過數據準備、環境搭建、模型訓練及微調、最終驗證等步驟,成功使模型能夠識別CT圖像並給出具體的診斷意見,與專業醫生的診斷結果高度吻合。 前

數據集 , 數據 , 神經網絡 , 人工智能 , 模態

收藏 評論

王校長的熱狗 - 12種動物數據集5527張VOC+YOLO

12種動物數據集5527張VOC+YOLO 數據集説明:數據集種圖片含有極少部分非真實動物圖片,如動物手工繪圖、印刷、雕像等等,佔比極少。 數據集格式:VOC格式+YOLO格式 壓縮包內含:3個文件夾,分別存儲圖片、xml、txt文件 JPEGImages文件夾中jpg圖片總計:5527 Annotat

數據集 , 動物數據集 , 後端開發 , txt文件 , Falcon , Python

收藏 評論

mb686fbcc4efbd6 - 電力場景無人機訓練輸電線杆塔缺陷檢測數據集VOC+YOLO格式2547張9類別

數據集格式:Pascal VOC格式+YOLO格式(不包含分割路徑的txt文件,僅僅包含jpg圖片以及對應的VOC格式xml文件和yolo格式txt文件) 圖片數量(jpg文件個數):2547 標註數量(xml文件個數):2547 標註數量(txt文件個數):2547 標註類別數:9 所在倉庫:firc-dataset 標註類別名稱(注意yol

數據集 , 後端開發 , JAVA , txt文件 , xml文件

收藏 評論

mob64ca13f87273 - 像數據科學家一樣思考:12步指南(中) - 阿里云云棲社區的個人空間 -

你可能正在處理來自不同醫院、不同設備或不同人羣的睡眠多導睡眠圖(PSG)材料集(比如 Sleep-EDF, SleepDG, HMC 等),並發現一個棘手的問題:在一個資料集上訓練得很好的模型,換到另一個內容集上效果就一落千丈。 這個問題,大家稱之為域偏差(Domain Bias)或域偏移(Domain Shift)。 這篇博客的唯一目的,就是帶你——一個“小白”——

數據集 , 資料集 , 後端開發 , 方差 , harmonyos

收藏 評論

mb686fbcc4efbd6 - 布料缺陷破洞油污檢測數據集VOC+YOLO格式896張4類別

數據集格式:Pascal VOC格式+YOLO格式(不包含分割路徑的txt文件,僅僅包含jpg圖片以及對應的VOC格式xml文件和yolo格式txt文件) 圖片數量(jpg文件個數):896 標註數量(xml文件個數):896 標註數量(txt文件個數):896 標註類別數:4 所在倉庫:firc-dataset 標註類別名稱(注意yolo格式

數據集 , 後端開發 , JAVA , txt文件 , xml文件

收藏 評論

mob649e815e6170 - Stable Diffusion示例

在這篇博文中,我將詳細介紹如何解決“Stable Diffusion示例”的問題。Stable Diffusion是一種廣泛應用於圖像生成和處理的先進深度學習模型,旨在通過提供合成圖像來滿足用户的具體需求。以下將根據環境準備、分步指南、配置詳解、驗證測試、優化技巧和排錯指南這幾個結構深入探討。 環境準備 軟硬件要求 組件 最低要求

數據集 , 硬件資源 , aigc , 優化技巧

收藏 評論

北京數據堂 - 71 種語言 + 125 種口音識別!AI 精準翻譯背後的數據力量!

當網易有道詞典“AI同傳”累計用户突破2000萬,支持71種語言互譯、精準識別125種口音,還能實現專業術語優化時,這不僅是一款產品的里程碑,更標誌着AI翻譯正在從“淺層轉譯”向“深度理解”加速演進。在全球化溝通日益頻繁的今天,AI翻譯正成為打破語言壁壘的核心力量,而這份亮眼成績的背後,是技術對多重挑戰的攻克,更是高質量數據的堅實支撐。 一

數據集 , 平行語料 , 發音詞典 , 有道翻譯 , 人工智能 , 深度學習 , 語音識別

收藏 評論

架構師李哲 - 16k數據撬動300億大模型!用Qwen3-VL打造了一位“頂尖放射科醫生”

僅用1.6萬張醫學影像,我們讓大模型學會了“看片子”。 患者提問:“請使用中文詳細描述這張圖像並給出你的診斷結果。” 這是微調前模型的回答。雖然能夠識別出基本病變,但其分析存在明顯不足,描述過於簡略,僅關注單一病灶而忽略了圖像中實際存在的雙肺多發性結節,且診斷結論過於武斷,直接定性為"良性腫瘤",缺乏嚴謹的鑑別診斷思

數據集 , 數據 , 人工智能 , 深度學習 , Json

收藏 評論