MMsegmentation项目中贡献自定义数据集的完整指南

最新推荐文章于 2025-06-11 09:20:01 发布

水鲁焘

最新推荐文章于 2025-06-11 09:20:01 发布

阅读量276

点赞数 4

本文链接：https://blog.csdn.net/gitblog_01200/article/details/148419447

版权

MMsegmentation项目中贡献自定义数据集的完整指南

mmsegmentation OpenMMLab Semantic Segmentation Toolbox and Benchmark. 项目地址: https://gitcode.com/gh_mirrors/mm/mmsegmentation

前言

在计算机视觉领域，语义分割是一项基础而重要的任务。MMsegmentation作为开源的语义分割工具箱，支持多种主流算法和数据集。本文将详细介绍如何在MMsegmentation项目中贡献一个标准格式的数据集，以高分2号卫星遥感图像数据集(GID)为例，帮助开发者理解数据集贡献的全流程。

环境准备

在开始数据集贡献前，需要配置好开发环境：

Python环境：建议使用Python 3.8版本
PyTorch：根据官方文档安装适合您系统的PyTorch版本
MMCV和MMEngine：使用MIM工具安装最新版本

pip install -U openmim
mim install mmengine
mim install "mmcv>=2.0.0"

数据集分析

GID数据集是我国自主研发的高分2号卫星拍摄的遥感图像数据集，具有以下特点：

图像尺寸：6800×7200像素
通道数：RGB三通道
标注类型：两种不同类别数的RGB标签(5类和15类)
5类标签包含：背景、建筑、农田、森林、草地和水体

在贡献数据集前，需要将大尺寸图像裁剪为512×512的小图，并将RGB标签转换为单通道mask标签。

数据集贡献流程

1. 创建项目目录

在mmsegmentation/projects下创建数据集专属目录gid_dataset，用于存放所有相关代码和配置文件。

2. 数据集转换工具

开发数据集转换脚本tools/dataset_converters/gid.py，主要功能包括：

图像裁剪：将大图分割为小图
标签转换：RGB标签转单通道mask
数据集划分：自动划分训练集和验证集

关键实现点：

def RGB2mask(RGB_label, colormap2label_list):
    # 将RGB三通道标签转换为单通道mask
    idx = (RGB_label[:, :, 0] * 256 + RGB_label[:, :, 1]) * 256 + RGB_label[:, :, 2]
    return colormap2label_list[idx]

3. 数据集类定义

在mmseg/datasets/gid.py中定义数据集类，需要指定：

类别名称(classes)
调色板(palette)
图像和标签后缀
是否忽略零标签(reduce_zero_label)

示例代码：

@DATASETS.register_module()
class GID_Dataset(BaseSegDataset):
    METAINFO = dict(
        classes=('Others', 'Built-up', 'Farmland', 'Forest', 'Meadow', 'Water'),
        palette=[[0, 0, 0], [255, 0, 0], [0, 255, 0], 
                [0, 255, 255], [255, 255, 0], [0, 0, 255]])

4. 配置文件

创建训练配置文件，需要包含：

基础模型配置
数据集配置
训练策略
评估指标

示例配置：

_base_ = [
    '../../../configs/_base_/models/deeplabv3plus_r50-d8.py',
    './_base_/datasets/gid.py',
    '../../../configs/_base_/default_runtime.py',
    '../../../configs/_base_/schedules/schedule_240k.py'
]