YOLOV4&YOLOV5学习笔记

原创已于 2022-03-07 00:39:21 修改 · 673 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #学习 #深度学习

于 2022-03-06 16:45:44 首次发布

深度学习之美同时被 2 个专栏收录

209 篇文章

订阅专栏

Python

131 篇文章

订阅专栏

本文详细介绍了YOLOV4和YOLOV5在目标检测领域的改进，包括标签平滑处理、SPP模块、特征融合策略、自对抗训练、GIOU_loss的局限性、数据增强技术如dropout和cutout的运用，以及dropblock的改良。此外，还探讨了网络结构的多样性，如s、m、l、x不同尺度的设计，并分析了预测阶段的优化问题。文章深入讨论了NMS过程中不使用CIOU_LOSS的原因，并总结了YOLO系列模型的关键优化技术对性能提升的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

YOLOV4&YOLOV5学习笔记

在这里插入图片描述

标签平滑处理来解决类别之间没有关联的问题。
1.
在这里插入图片描述
2.

3.
spp一堆池化的组合
4.

5.
特征融合的方法

在这里插入图片描述
6.
自对抗训练就是自监督训练

在这里插入图片描述

在这里插入图片描述
9.

第一个改进，将主干网络中的激活函数改了
在这里插入图片描述
11.

新加了spp块，增加感受视野，
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
14.
yolov3没有告诉候选框应该往哪个方向上去回归

15.
状态3的效果比状态2更好，状态3移动更简单，状态2移动更复杂

16.

在这里插入图片描述
17.

GIOU_loss不能衡量下图这种情况

在这里插入图片描述
18.

在这里插入图片描述

在这里插入图片描述
20.
在NMS时不使用CIOU_LOSS是因为，使用CIOU_LOSS需要使用目标框的长和宽，但是在做NMS时，已经是预测阶段了，在预测阶段根本没有目标框。

21.
数据增强

22.
作者使用dropout是为了让中间层的神经网络也能获得想cutout的作用和效果。因为如果你只是使用cutout’时这只是对输入数据进行了数据增强，但是神经网络是很聪明的，如果在神经网络中不使用dropout，那么在神经网络中就不能获得cutout’带来的好处，因为神经网络会将cutout的图片，经过神经网络后，恢复成完整图片，所以这里在神经网络中使用了dropout。
在这里插入图片描述
23.
cutout缺点:遮挡的部分是连成的一个整体，而且使规则的，而且这个规则的遮挡对于卷积来说是无效的，因为对于浅层的卷积接收到的数据确实是不完整的，但是对于中间层和最后的卷积，图片经过前面的处理，到达中间层和最后层的图片就已经是完整的了。
24.
普通的dropout是随机的对于目标区域而言遮挡效果不是很好，遮挡的区域太少，下图中的dropout就好像给图片加了一些噪音，所以对它进行了改造，使用的是dropblock，遮挡的区域更大。这样的改变即增大了遮挡的面积，也保证了核心的目标区域不至于全部被遮挡完全。
在这里插入图片描述