優點
✅ 識別率高,支持繁簡中文和手寫識別
✅ 支持角度檢測,避免文字方向影響識別效果
✅ 還能識別表格、票據等複雜場景
方法
pip install paddleocr
pip install paddlepaddle
(如果你有 GPU,可以安裝 paddlepaddle-gpu 以加速識別)
使用示例
from paddleocr import PaddleOCR
ocr = PaddleOCR(use_angle_cls=True, lang="ch") # 使用中文模型,支持角度校正
result = ocr.ocr("example.png", cls=True) # 識別圖像
for line in result:
print(line) # 輸出識別結果
指定GPU加速
from paddleocr import PaddleOCR
# 初始化 OCR,強制使用 GPU(如果有多張 GPU,可以設置 use_gpu=0, 1, 2...)
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0)
# 讀取圖片並識別
result = ocr.ocr("example.png", cls=True)
# 輸出識別結果
for line in result:
print(line)
返回JSON
import json
from paddleocr import PaddleOCR
# 初始化 OCR,使用 GPU
ocr = PaddleOCR(use_angle_cls=True, lang="ch", use_gpu=0)
# 讀取圖片並識別
result = ocr.ocr("example.png", cls=True)
# 處理結果,提取文字信息
output_data = []
for line in result:
for word_info in line:
text = word_info[1][0] # 獲取識別的文本
confidence = word_info[1][1] # 獲取置信度
output_data.append({"text": text, "confidence": confidence})
# 轉換為 JSON 格式
json_output = json.dumps(output_data, ensure_ascii=False, indent=4)
# 輸出 JSON 結果
print(json_output)
識別效果