【目标检测01】真实框、预测框、锚框和交并比IoU

贝与贝

已于 2024-10-24 13:58:18 修改

阅读量1.8k

点赞数 30

CC 4.0 BY-SA版权

文章标签：目标检测计算机视觉深度学习人工智能机器学习 1024程序员节

于 2024-10-24 13:54:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42819022/article/details/143206034

文章目录

1. 任务定义

目标检测的主要目的是让计算机可以自动识别图片或者视频帧中所有目标的类别，并在该目标周围绘制边界框，标示出每个目标的位置，如图所示。
在这里插入图片描述

2. 基本概念

2.1 边界框（bounding box）

检测任务需要同时预测物体的类别和位置，因此需要引入一些跟位置相关的概念。通常使用边界框（bounding box，bbox）来表示物体的位置，边界框是正好能包含物体的矩形框，如下图所示，图中3个人分别对应3个边界框。
在这里插入图片描述
一般有两种表示边界框位置的格式：

(1) $x y x y$ ，即 $(x 1, y 1, x 2, y 2)$ ，其中 $(x 1, y 1)$ 是矩形框左上角的坐标， $(x 2, y 2)$ 是矩形框右下角的坐标。

(2) $x y w h$ ，即 $(x, y, w, h)$ ，其中 $(x, y)$ 是矩形框的中心坐标， $w$ 是矩形框的宽度， $h$ 是矩形框的高度。

因此，在阅读代码的时候，要注意使用的是哪一种格式的表示方式。

2.2 真实框、预测框和锚框

从训练数据集的标签里给出目标物体边界框所对应的位置叫真实框

由模型预测出目标物体边界框所对应的位置叫预测框

不同于真实框和预测框，锚框是人为预先设定好的矩形框，模型在这种锚框的基础上预测偏移量才能得到预测框

2.3 交并比 (IoU)

如何衡量预测框和真实框之间的关系呢？在检测任务中是使用交并比（Intersection of Union，IoU）作为衡量指标。这一概念来源于数学中的集合，用来描述两个集合A和B之间的关系，它等于两个集合的交集里面所包含的元素个数，除以它们的并集里面所包含的元素个数，具体计算公式如下：
$\frac{A \cap B}{A \cup B}$ 我们将用这个概念来描述两个框之间的重合度。两个框可以看成是两个像素的集合，它们的交并比等于两个框重合部分的面积除以它们合并起来的面积。下图“交集”中青色区域是两个框的重合面积，图“并集”中蓝色区域是两个框的相并面积。用这两个面积相除即可得到它们之间的交并比。
在这里插入图片描述
假设两个矩形框A和B的位置分别为：
$A: [x_{a1}, y_{a1}, x_{a2}, y_{a2}] \\ A: [x_{b1}, y_{b1}, x_{b2}, y_{b2}]$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。