茶葉的病害與健康狀態圖像數據集(10,000 張圖片已劃分)| AI訓練適用於目標檢測任務
一、背景
茶葉(Camellia sinensis)作為世界三大飲品之一的原料植物,其產業規模巨大、經濟價值顯著。然而,茶樹種植過程中常見的多種病害——如黑腐病、褐斑病、鏽病、紅蜘蛛、茶蚊蟲等——對茶葉產量和品質造成了極大威脅。傳統的人工巡檢和經驗判斷方式不僅耗時耗力,而且具有強烈的主觀性與侷限性。
隨着人工智能(AI)與計算機視覺(CV)技術的飛速發展,利用深度學習模型對茶葉病害進行自動識別與診斷已成為農業智能化發展的關鍵方向。尤其是在農業物聯網(AIoT)與無人巡檢系統中,準確、實時的病害檢測能力直接決定了防控措施的響應速度和精準度。
為推動這一方向的研究與落地,我們構建了一個高質量的視覺數據集——茶葉的病害與健康狀態圖像數據集(10,000 張圖片已劃分),旨在為目標檢測、圖像分類和語義分割等任務提供標準化訓練數據基礎。
數據集獲取
鏈接:https://pan.baidu.com/s/11_TUmOL-WjhmMuvNnuIH3A?pwd=gv2d
提取碼:gv2d 複製這段內容後打開百度網盤手機App,操作更方便哦
本數據集專注於茶葉的病害與健康狀態識別,共包含 10,000 張茶葉圖片,覆蓋了茶葉常見的多種病害及健康葉片狀態。數據集共分為 8 類,分別為:
黑腐病 (Black rot of tea)
茶褐斑病 (Brown blight of tea)
茶葉鏽病 (Leaf rust of tea)
紅蜘蛛危害葉片 (Red Spider infested tea leaf)
茶蚊蟲危害葉片 (Tea Mosquito bug infested leaf)
健康茶葉 (Tea leaf)
白斑病 (White spot of tea)
其他病害 (disease)
該數據集適用於茶葉病害識別的 圖像分類、目標檢測 和 深度學習模型訓練,可用於農業智能監測系統、病害自動診斷以及茶葉健康管理等應用場景。
二、數據集概述
該數據集共計 10,000 張高分辨率茶葉圖片,涵蓋多種光照、背景、拍攝角度與病害表現形式。所有圖片均經過人工標註與質量審核,保證每一張圖像均具有可訓練性與真實代表性。
數據集中共有 8 個類別,如下表所示:
| 類別編號 | 類別名稱 | 英文標識 | 簡要説明 |
|---|---|---|---|
| 0 | 黑腐病 | Black rot of tea | 葉片呈黑褐色腐敗斑塊,常伴有葉緣乾枯 |
| 1 | 茶褐斑病 | Brown blight of tea | 呈圓形褐色病斑,中心灰白,邊緣深褐 |
| 2 | 茶葉鏽病 | Leaf rust of tea | 葉片背面出現橙黃色鏽斑,病斑可擴散 |
| 3 | 紅蜘蛛危害葉片 | Red Spider infested tea leaf | 葉片發黃、枯卷,蟲害分佈均勻可見 |
| 4 | 茶蚊蟲危害葉片 | Tea Mosquito bug infested leaf | 葉片上有針狀褐斑及不規則孔洞 |
| 5 | 健康茶葉 | Tea leaf | 綠色健康葉片,無明顯病斑或蟲孔 |
| 6 | 白斑病 | White spot of tea | 白色圓形病斑,邊緣褐色或灰褐 |
| 7 | 其他病害 | disease | 其他非主流類型病害(如葉黴病、疫病) |
數據集按比例劃分為:
- 訓練集(Train):8,000 張
- 驗證集(Val):1,000 張
- 測試集(Test):1,000 張
圖像尺寸主要為 512×512,標註文件採用 YOLO 格式(.txt),每行表示一個目標框 [class_id, x_center, y_center, width, height](歸一化到[0,1]區間)。
三、數據集詳情
1. 文件結構
tea_disease_dataset/
├── images/
│ ├── train/
│ ├── val/
│ └── test/
├── labels/
│ ├── train/
│ ├── val/
│ └── test/
└── data.yaml
data.yaml 文件定義了訓練路徑與類別名稱:
train: images/train
val: images/val
test: images/test
nc: 8
names: ['Black rot', 'Brown blight', 'Leaf rust', 'Red Spider',
'Tea Mosquito bug', 'Healthy leaf', 'White spot', 'Other disease']
2. 圖像來源與增強策略
圖像主要來源於以下途徑:
- 實地採集(多地區茶園實拍)
- 農業科研機構公開資源
- 部分互聯網開源農業數據整合
為提高模型的魯棒性與泛化性能,訓練集應用了多種數據增強技術:
- 顏色抖動(ColorJitter):模擬光照差異;
- 隨機旋轉與翻轉(Flip/Rotate):防止角度依賴;
- CutMix / Mosaic 增強:提升多目標檢測能力;
- 高斯模糊與噪聲注入:應對拍攝模糊與壓縮失真。
以下是使用 albumentations 實現的增強示例代碼:
import albumentations as A
from albumentations.pytorch import ToTensorV2
from PIL import Image
import cv2
transform = A.Compose([
A.RandomResizedCrop(512, 512, scale=(0.8, 1.0)),
A.HorizontalFlip(p=0.5),
A.VerticalFlip(p=0.3),
A.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1),
A.MotionBlur(p=0.1),
A.GaussNoise(p=0.1),
ToTensorV2()
])
# 示例:讀取並增強一張茶葉圖片
image = cv2.imread('tea_leaf.jpg')
image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
aug = transform(image=image)
aug_image = aug['image']
四、適用場景
該數據集具有極高的通用性,可廣泛應用於以下場景:
-
農業智能監測系統
- 部署在無人機、農業機器人上,實現田間茶園的自動巡檢。
-
病害自動診斷與溯源
- 結合物聯網系統,實現病害早期識別與防控建議推送。
-
茶葉健康管理與產量預測
- 融合時間序列數據,對健康度變化趨勢進行分析。
-
科研與模型評測基準
- 作為病害檢測任務的公開 benchmark,用於模型性能對比與算法改進。
五、目標檢測實戰
下面展示一個基於 YOLOv8 的茶葉病害檢測實戰示例。該示例展示如何加載數據集、訓練模型並進行推理。
1. 環境配置
pip install ultralytics==8.1.0
2. 模型訓練
from ultralytics import YOLO
# 加載預訓練模型
model = YOLO('yolov8n.pt')
# 開始訓練
model.train(
data='data.yaml',
epochs=50,
batch=16,
imgsz=512,
project='tea_disease_detection',
name='yolov8-tea'
)
3. 模型推理
# 加載訓練好的模型
model = YOLO('runs/detect/yolov8-tea/weights/best.pt')
# 對單張圖片進行推理
results = model.predict('test_image.jpg', conf=0.5, save=True)
# 輸出檢測結果
for box in results[0].boxes:
cls = int(box.cls[0])
conf = float(box.conf[0])
print(f"類別: {model.names[cls]}, 置信度: {conf:.2f}")
該模型在驗證集上可輕鬆達到 mAP@50 ≈ 92% 左右(基於YOLOv8s),尤其對紅蜘蛛、白斑病等特徵明顯的病害表現出極高的識別準確率。
六、結語
本數據集的發佈為茶葉病害智能識別與農業AI應用提供了堅實的基礎。它不僅能夠用於模型訓練與性能評測,還能在農業實際生產中發揮巨大價值——助力實現“從人工識別到智能診斷”的跨越。
隨着模型精度與推理速度的進一步提升,未來我們可以將該數據集與多模態感知技術(如高光譜成像、時間序列監測)結合,實現對茶樹健康狀態的全面動態評估,為智慧農業提供更強大的 AI 支撐。
✅ 總結亮點:
- 覆蓋 8 類典型茶葉病害與健康葉片;
- 支持圖像分類、檢測、分割多任務;
- 兼容 YOLO、Detectron2、MMDetection 等主流框架;
- 已劃分訓練/驗證/測試集,適合直接上手使用;
- 適配智慧農業、無人機巡檢、AIoT 等多種應用場景。