基于Transformer的YOLOv5小目标检测器 | 四头加注意力

迪菲赫尔曼

已于 2023-06-17 00:02:45 修改

阅读量1.4w

点赞数 19

CC 4.0 BY-SA版权

分类专栏： YOLOv5/v7改进实战文章标签： 1024程序员节论文人工智能

于 2022-10-24 01:27:26 首次发布

原创文章为博主个人所有，未经授权不得转载、摘编、传播、倒卖、洗稿或利用其它方式使用上述作品。违反上述声明者，本站将追求其相关法律责任。

本文链接：https://blog.csdn.net/weixin_43694096/article/details/127484243

YOLOv5/v7改进实战专栏收录该内容

51 篇文章 ¥99.90 ¥299.90

订阅专栏

TPH-YOLOv5针对无人机图像中的小目标检测，通过增加预测头、引入Transformer Prediction Heads (TPH) 和卷积块注意力模型(CBAM)，改善尺度变化和运动模糊问题。在VisDrone2021数据集上，该模型表现出色，提高性能，与SOTA方法相比有显著提升。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在这里插入图片描述
论文地址：https://arxiv.org/pdf/2108.11539.pdf
项目地址：https://github.com/cv516Buaa/tph-yolov5

在无人机捕获的场景中进行对象检测是最近的一项热门任务。由于无人机总是在不同的高度航行，物体尺度变化剧烈，给网络优化带来了负担。此外，高速和低空飞行会在密集的物体上带来运动模糊，这给物体识别带来了很大的挑战。为了解决上述两个问题，我们提出了 TPH-YOLOv5。在 YOLOv5 的基础上，我们增加了一个预测头来检测不同尺度的物体。然后我们用 Transformer Prediction Heads (TPH) 替换原来的预测头，以利用自注意力机制探索预测潜力。我们还集成了卷积块注意模型 (CBAM)，以在具有密集对象的场景中找到注意区域。为了进一步改进我们提出的 TPH-YOLOv5，我们提供了许多有用的策略，例如数据增强、多尺度测试、多模型集成和利用额外的分类器。对数据集 Vis

了解本专栏

评论 45

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

迪菲赫尔曼 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。