怎么制作自己的yolo数据集
时间: 2025-06-27 18:15:00 浏览: 16
### 创建适用于YOLO模型训练的数据集
为了使自定义数据集能够被YOLO框架有效利用,需遵循特定结构和标注方式。以下是关于如何准备此类数据集的具体说明。
#### 数据集目录结构
构建一个合理的文件夹架构对于顺利导入至关重要。通常情况下,应建立如下所示的基础布局:
```
dataset/
├── images/
│ ├── train/
│ └── val/
└── labels/
├── train/
└── val/
```
此结构有助于区分训练集与验证集中的图像及其对应的标签文件[^1]。
#### 图像收集与预处理
获取足够的样本图片是首要任务。这些图应当覆盖目标类别可能出现的各种场景变化。之后,对所有采集到的原始素材实施标准化操作,比如调整尺寸至统一规格(如640×640像素),这一步骤可以提高后续处理效率并减少计算资源消耗。
#### 标签生成
针对每一张用于训练的照片,都需要创建相应的`.txt`格式标签文档。每个文本文件内含若干行记录,每一行代表单个物体实例的位置信息以及所属分类编号。具体而言,一行完整的描述由五个数值构成:类目索引、中心坐标X比例值、Y比例值、宽度比例值、高度比例值。值得注意的是,这里提到的比例均基于整张照片的实际分辨率来计算得出。
```plaintext
<class_index> <center_x_ratio> <center_y_ratio> <width_ratio> <height_ratio>
```
例如,在一幅分辨率为640x640的画面里标记一辆汽车,则对应条目可能是这样的形式呈现:
```plaintext
0 0.5 0.5 0.2 0.3
```
上述例子意味着该车辆位于画面中央附近,占据大约五分之一宽高范围内的区域,并且属于第零号种类——即假设设定的第一种待识别物品种类。
#### 配置文件编写
最后还需准备好配置文件(`data.yaml`)以便告知YOLO有关于当前项目所涉及的各项参数详情,包括但不限于各类别的名称列表、训练/测试用例路径等重要设置项。下面给出了一份简化版模板供参考:
```yaml
# data.yaml example configuration file for custom dataset
path: ./datasets/custom_dataset # Root directory of the dataset.
train: images/train # Path to training image folder relative from root dir above.
val: images/val # Path to validation image folder.
nc: 8 # Number of classes (objects you want to detect).
names: ['car', 'person', ... ] # List all class names here as strings inside single quotes separated by commas.
```
完成以上准备工作后即可按照既定流程启动模型训练过程。
阅读全文
相关推荐
















