高质量车牌识别数据集推荐(10k张图像)| 支持目标检测任务
高质量车牌识别数据集
数据集概述
在从事车牌识别(License Plate Recognition, LPR)或智能交通系统(ITS)相关项目的过程中,一个高质量的数据集是不可或缺的。今天要分享的是一个包含 10,000 张图像 的车牌数据集,非常适用于 目标检测任务,如训练 YOLO、DETR、RT-DETR 等模型。
图片数量:10k+
标注内容:每张图像中标注了 车牌区域的位置框(bounding box)
数据类型:适用于目标检测任务(Object Detection)
标签类别:仅包含 License_Plate 一类
✅ 应用场景
这个数据集的适用范围非常广,特别适合以下实际场景中的模型训练或算法验证:
交通执法与安全
自动检测和记录交通违法、被盗车辆的车牌
用于刑事侦查或违规查询等系统
停车场管理
自动识别进出车辆,便于无接触停车和车位统计
提高停车场的运营效率
高速公路收费
应用于ETC或自动收费站,实现不停车快速通过
门禁与身份认证
小区、园区、单位门口自动识别车辆身份,提升通行效率与安全性
交通数据分析
城市交通流量监控,生成实时交通热力图或路况分析报告
为城市规划提供决策支持数据
🖼️ 数据样例展示
从样例图可以看到,图像中车辆的车牌被准确地框选出来,适用于目标检测任务中的训练与验证过程。
🧠 模型推荐
配合此数据集,可以训练和测试以下类型的模型:
YOLOv5 / YOLOv8
RT-DETR / DETR
Faster R-CNN / SSD
MobileNet-SSD(适合部署)
以及各类轻量级模型(适用于边缘设备)
高质量车牌识别数据集推荐(10k张图像)
本教程介绍如何使用 YOLOv8 对电网巡检绝缘子 阻尼器 变压器等目标进行识别与检测。涵盖环境配置、数据准备、训练模型、模型推理和部署等全过程。
📦 1. 环境配置
建议使用 Python 3.8+,并确保支持 CUDA 的 GPU 环境。
# 创建并激活虚拟环境(可选)
python -m venv yolov8_env
source yolov8_env/bin/activate # Windows 用户使用 yolov8_env\Scripts\activate
安装 YOLOv8 官方库 ultralytics
pip install ultralytics
📁 2. 数据准备
2.1 数据标注格式(YOLO)
每张图像对应一个 .txt 文件,每行代表一个目标,格式如下:
<class_id> <x_center> <y_center> <width> <height>
所有值为相对比例(0~1)。
类别编号从 0 开始。
2.2 文件结构示例
datasets/
├── images/
│ ├── train/
│ └── val/
├── labels/
│ ├── train/
│ └── val/
2.3 创建 data.yaml 配置文件
path: ./datasets
train: images/train
val: images/val
nc: 11
names: ['Bent_Insulator', 'Broken_Insulator_Cap', '', ...]
🚀 3. 模型训练
YOLOv8 提供多种模型:yolov8n, yolov8s, yolov8m, yolov8l, yolov8x。可根据设备性能选择。
yolo detect train \
model=yolov8s.pt \
data=./data.yaml \
imgsz=640 \
epochs=50 \
batch=16 \
project=weed_detection \
name=yolov8s_crop_weed
参数 | 类型 | 默认值 | 说明 |
---|---|---|---|
model | 字符串 | - | 指定基础模型架构文件或预训练权重文件路径(.pt /.yaml ) |
data | 字符串 | - | 数据集配置文件路径(YAML 格式),包含训练/验证路径和类别定义 |
imgsz | 整数 | 640 | 输入图像的尺寸(像素),推荐正方形尺寸(如 640x640) |
epochs | 整数 | 100 | 训练总轮次,50 表示整个数据集会被迭代 50 次 |
batch | 整数 | 16 | 每个批次的样本数量,值越大需要越多显存 |
project | 字符串 | - | 项目根目录名称,所有输出文件(权重/日志等)将保存在此目录下 |
name | 字符串 | - | 实验名称,用于在项目目录下创建子文件夹存放本次训练结果 |
关键参数补充说明:
-
model=yolov8s.pt
- 使用预训练的 YOLOv8 small 版本(平衡速度与精度)
- 可用选项:
yolov8n.pt
(nano)/yolov8m.pt
(medium)/yolov8l.pt
(large)
-
data=./data.yaml
# 典型 data.yaml 结构示例 path: ../datasets/weeds train: images/train val: images/val names: 0: Bent_Insulator 1: Broken_Insulator_Cap 2: ... 3: ...
📈 4. 模型验证与测试
4.1 验证模型性能
yolo detect val \
model=runs/detect/yolov8s_crop_weed/weights/best.pt \
data=./data.yaml
参数 | 类型 | 必需 | 说明 |
---|---|---|---|
model | 字符串 | 是 | 要验证的模型权重路径(通常为训练生成的 best.pt 或 last.pt ) |
data | 字符串 | 是 | 与训练时相同的 YAML 配置文件路径,需包含验证集路径和类别定义 |
关键参数详解
-
model=runs/detect/yolov8s_crop_weed/weights/best.pt
- 使用训练过程中在验证集表现最好的模型权重(
best.pt
) - 替代选项:
last.pt
(最终epoch的权重) - 路径结构说明:
runs/detect/ └── [训练任务名称]/ └── weights/ ├── best.pt # 验证指标最优的模型 └── last.pt # 最后一个epoch的模型
- 使用训练过程中在验证集表现最好的模型权重(
-
data=./data.yaml
- 必须与训练时使用的配置文件一致
- 确保验证集路径正确:
val: images/val # 验证集图片路径 names: 0: crop 1: weed
常用可选参数
参数 | 示例值 | 作用 |
---|---|---|
batch | 16 | 验证时的批次大小 |
imgsz | 640 | 输入图像尺寸(需与训练一致) |
conf | 0.25 | 置信度阈值(0-1) |
iou | 0.7 | NMS的IoU阈值 |
device | 0/cpu | 选择计算设备 |
save_json | True | 保存结果为JSON文件 |
典型输出指标
Class Images Instances P R mAP50 mAP50-95
all 100 752 0.891 0.867 0.904 0.672
crop 100 412 0.912 0.901 0.927 0.701
weed 100 340 0.870 0.833 0.881 0.643
4.2 推理测试图像
yolo detect predict \
model=runs/detect/yolov8s_crop_weed/weights/best.pt \
source=./datasets/images/val \
save=True
🧠 5. 自定义推理脚本(Python)
from ultralytics import YOLO
import cv2
# 加载模型
model = YOLO('runs/detect/yolov8s_crop_weed/weights/best.pt')
# 推理图像
results = model('test.jpg')
# 可视化并保存结果
results[0].show()
results[0].save(filename='result.jpg')
🛠 6. 部署建议
✅ 本地运行:通过 Python 脚本直接推理。
🌐 Web API:可用 Flask/FastAPI 搭建检测接口。
📦 边缘部署:YOLOv8 支持导出为 ONNX,便于在 Jetson、RKNN 等平台上部署。
导出示例:
yolo export model=best.pt format=onnx
📌 总结流程
阶段 | 内容 |
---|---|
✅ 环境配置 | 安装 ultralytics, PyTorch 等依赖 |
✅ 数据准备 | 标注图片、组织数据集结构、配置 YAML |
✅ 模型训练 | 使用命令行开始训练 YOLOv8 模型 |
✅ 验证评估 | 检查模型准确率、mAP 等性能指标 |
✅ 推理测试 | 运行模型检测实际图像目标 |
✅ 高级部署 | 导出模型,部署到 Web 或边缘设备 |