YOLOv5改进（CoordConv）

最新推荐文章于 2025-06-17 09:33:42 发布

eagleflying_cau

最新推荐文章于 2025-06-17 09:33:42 发布

阅读量1.2k

点赞数 3

CC 4.0 BY-SA版权

文章标签： YOLO

本文链接：https://blog.csdn.net/eagleflying_cau/article/details/131150638

文章介绍了一种名为CoodConv的新方法，它通过在卷积层中添加输入的i、j坐标信息来改进网络性能。具体实现是在模型的common.py文件中定义了一个AddCoords类，然后在yolo.py的parse_model中应用了CoordConv层。该方法通过引入位置信息，提高了网络对图像位置特征的学习能力，适用于目标检测等任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1.CoodConev原文地址：

https://arxiv.org/pdf/1807.03247v2.pdf

2.改进策略，在原有卷积上增加了i、j坐标

3.方法：

（1）将下面代码放到models/commen.py中

lass AddCoords(nn.Module):

    def __init__(self, with_r=False):
        super().__init__()
        self.with_r = with_r

    def forward(self, input_tensor):
        """
        Args:
            input_tensor: shape(batch, channel, x_dim, y_dim)
        """
        batch_size, _, x_dim, y_dim = input_tensor.size()

        xx_channel = torch.arange(x_dim).repeat(1, y_dim, 1)
        yy_channel = torch.arange(y_dim).repeat(1, x_dim, 1).transpose(1, 2)

        xx_channel = xx_channel.float() / (x_dim - 1)