YoloV8改进策略：BackBone改进|PKINet

AI智韵

已于 2024-10-04 18:24:28 修改

阅读量3.5k

点赞数 23

CC 4.0 BY-SA版权

分类专栏： 2024年YoloV8改进创新指南 (2025年最新改进)YoloV8涨点改进——高阶篇文章标签： YOLO 目标跟踪人工智能

于 2024-03-18 21:08:43 首次发布

不能复制，转发

本文链接：https://blog.csdn.net/m0_47867638/article/details/136821858

(2025年最新改进)YoloV8涨点改进——高阶篇同时被 2 个专栏收录

221 篇文章 ¥199.90 ¥299.90

订阅专栏

2024年YoloV8改进创新指南

139 篇文章 ¥159.90 ¥299.90

订阅专栏

本文介绍了PKINet，一种针对遥感旋转框检测的主干网络，其包含CAA和PKI模块，用于解决遥感图像中目标尺度变化和上下文环境的挑战。通过取代YoloV8的主干网络，PKINet在四个遥感检测基准上提高了性能。PKINet采用无空洞多尺度卷积和CAA模块，有效地提取不同尺度目标特征并捕获上下文信息。实验结果显示，PKINet在DOTA、HRSC2016和DIOR-R数据集上表现出色，且比传统方法更为轻量级。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

摘要

PKINet是面向遥感旋转框的主干，网络包含了CAA、PKI等模块，给我们改进卷积结构的模型带来了很多启发。本文，使用PKINet替代YoloV8的主干网络，实现涨点。PKINet是我在作者的模型基础上，重新修改了底层的模块，方便大家轻松移植到YoloV8上。

论文：《Poly Kernel Inception Network在遥感检测中的应用》

https://export.arxiv.org/pdf/2403.06258
遥感图像（RSI）中的目标检测经常面临一些日益严重的挑战，包括目标尺度的巨大变化和多样的上下文环境。先前的方法试图通过扩大骨干网络的空间感受野来解决这些挑战，要么通过大核卷积，要么通过空洞卷积。然而，前者通常会引入大量的背景噪声，而后者则可能生成过于稀疏的特征表示。在本文中，我们引入了Poly Kernel Inception Network（PKINet）来处理上述挑战。PKINet采用无空洞的多尺度卷积核来提取不同尺度的目标特征并捕获局部上下文。此外，我们还并行引入了一个Context Anchor Attention（CAA）模块来捕获长距离上下文信息。这两个组件共同作用，提高了PKINet在四个具有挑战性的遥感检测基准上的性能，即DOTA-v1.0、DOTA-v1.5、HRSC2016和DIOR-R。
在这里插入图片描述