对COCO数据集的简单理解

命名无能

于 2020-01-03 19:09:18 发布

阅读量847

点赞数

CC 4.0 BY-SA版权

分类专栏： # MaskRCNN 文章标签：计算机视觉 COCO数据集图像处理

本文链接：https://blog.csdn.net/qiancaobaicheng/article/details/103825356

MaskRCNN 专栏收录该内容

3 篇文章

订阅专栏

本文介绍了COCO数据集在计算机视觉和图像处理中的应用，并详细解析了COCO数据集的标注格式，包括JSON文件的5种基本结构体类型，帮助读者深入理解数据集的组织方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

许多图像处理的问题可能都要用到COCO数据集，了解COCO数据集的标注格式有助于我们后续的学习。

这篇文章解释的很清楚：
参考文章：MSCOCO数据标注详解

说到底，就是去看json文件，对json文件进行简单分类查看，会发现——基本的JSON结构体类型有以下5种：

{
    "info": info, # dict
    "licenses": [license], # list ，内部是dict
    "images": [image], # list ，内部是dict
    "annotations": [annotation], # list ，内部是dict
    "categories": # list ，内部是dict
}

具体结构为：

info{
    "year": int,
    "version": str,
    "description": str,
    "contributor": str,
    "url": str,
    "date_created": datetime,
}

license{
    "id": int,
    "name": str,
    "url": str,
} 

image{
    "id": int,
    "width": int,
    "height": int,
    "file_name": str,
    "license": int,
    "flickr_url": str,
    "coco_url": str,
    "date_captured": datetime,
}

annotation{
    "id": int,
    "image_id": int,
    "category_id": int,
    "segmentation": RLE or [polygon],
    "area": float,
    "bbox": [x,y,width,height],
    "iscrowd": 0 or 1,
}

categories{
    "id": int,
    "name": str,
    "supercategory": str,
}