论文解读：EMA:Efficient Multi-Scale Attention Module with Cross-Spatial Learning（2023）

最新推荐文章于 2025-03-03 01:00:00 发布

popoluoluo

最新推荐文章于 2025-03-03 01:00:00 发布

阅读量1.3k

点赞数 2

CC 4.0 BY-SA版权

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/popoluoluo/article/details/142555610

1.效果

2.模型结构

3.与ca对比

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

popoluoluo

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

SwinTransformer改进（10）：Efficient Multi-scale Attention (EMA) 增强的 Swin Transformer 模型

2401_82355416的博客

05-08

135

在保持Swin Transformer原有层次结构的同时，增加了多尺度注意力机制通过分组处理提高了计算效率空间注意力机制增强了模型对重要特征的关注能力灵活的维度转换使得EMA可以无缝集成到Swin架构中。

【YOLOv8改进-注意力机制】EMA（Efficient Multi-Scale Attention）：基于跨空间学习的高效多尺度注意力

专注于图像领域，主要研究内容包括计算机视觉和深度学习，特别是在图像分类、目标检测和图像生成等方面有深入的研究和实践经验。

05-23

5444

【YO通道或空间注意力机制在许多计算机视觉任务中表现出显著的效果，可以生成更清晰的特征表示。然而，通过通道维度缩减来建模跨通道关系可能会对提取深度视觉表示带来副作用。本文提出了一种新颖高效的多尺度注意力（EMA）模块。该模块着重于保留每个通道的信息并减少计算开销，我们将部分通道重新调整为批次维度，并将通道维度分组为多个子特征，使空间语义特征在每个特征组内分布均匀。具体来说，除了在每个并行分支中对全局信息进行编码以重新校准通道权重外，这两个并行分支的输出特征还通过跨维度交互进一步聚合，以捕捉像素级的成对关系。

参与评论您还未登录，请先登录后发表或查看评论

Efficient Multi-Scale Attention Module with Cross-Spatial Learning

qq_46577556的博客

07-11

793

Efficient Multi-Scale Attention Module with Cross-Spatial Learning

即插即用篇 | YOLOv8 引入具备跨空间学习的高效多尺度注意力 Efficient Multi-Scale Attention | 《ICASSP 2023 最新论文》

YOLOv8项目贡献者

07-13

7414

ICASSP 2023🏅 YOLOv8 添加 EMA 模块与 C2f_EMA 模块

EMA：基于跨空间学习的高效多尺度注意力模块

AI浩

06-23

2万+

在各种计算机视觉任务中，通道或空间注意力机制在产生更清晰的特征表示方面的显著有效性得到了证明。然而，通过通道降维来建模跨通道关系可能会给提取深度视觉表示带来副作用。提出了一种新的高效的多尺度注意力(EMA)模块。以保留每个通道上的信息和降低计算开销为目标，将部分通道重塑为批量维度，并将通道维度分组为多个子特征，使空间语义特征在每个特征组中均匀分布。具体来说，除了对全局信息进行编码以重新校准每个并行分支中的通道权重外，还通过跨维度交互进一步聚合两个并行分支的输出特征，以捕获像素级成对关系。

注意力模块

qq_44199379的博客

11-27

2799

简要总结常见的注意力机制，并提供图示和下载地址

YOLOv8改进:添加EMA注意力机制

ShawN1022的博客

09-13

1万+

用YOLOv5x作为骨干CNN在VisDrone数据集上进行目标检测，其中CA, CBAM和EMA注意力分别集成到检测器中。从表2的结果可以看出，CA, CBAM和EMA都可以提高目标检测的基线性能。/EMA.py文件中新建一个名为EMA.py文件，将下述代码复制到EMA.py文件中并保存。本文提出了一种新的跨空间学习方法，并设计了一个多尺度并行子网络来建立短和长依赖关系。EMA的位置可以改变，看个人的数据集效果，改注意编号的变化。运行的时候看框架可以看到EMA说明添加成功。录用：ICASSP2023。

【Block总结】EMA，高效多尺度注意力模块|即插即用

热门推荐

weixin_47151388的博客

05-23

2万+

在各种计算机视觉任务中，通道或空间注意机制对于产生更多可识别的特征表示具有显着的有效性。然而，通过通道降维来建模跨通道关系可能会对提取深度视觉表征带来副作用。本文提出了一种新型的高效多尺度注意力(EMA)模块。为了保留每个通道上的信息和减少计算开销，我们将部分通道重构为批处理维度，并将通道维度分组为多个子特征，使空间语义特征在每个特征组内均匀分布。具体而言，除了编码全局信息以重新校准每个并行分支中的通道权重外，还通过跨维交互进一步聚合两个并行分支的输出特征，以捕获像素级成对关系。

时间序列分析论文翻译与笔记：The correct way to start an Exponential Moving Average (EMA)

HUSTGO的博客

07-12

1571

在之前的笔记中，我们初步认识了指数移动平均（），本文将通过翻译一篇在2017年的一篇博客，讨论如何确保移动平均数能够通过识别记录信息的时长，来适应新的信息。（原文的代码为R，本文将补充py代码）

pytorch代码实现注意力机制之EMA

DM_zx的博客

09-06

1万+

注意力机制之EMA

三分钟学会使用系列（YOLOv5）|EMA注意力机制，涨点神器！

深度学习炼丹师，偶尔分享炼丹技术!

01-27

6945

本文旨在让读者快速了解相关技术并运用,欢迎关注。

【论文阅读】一些轻量的有效的attention module的介绍

hgj1h的博客

05-17

2420

最近在看论文，发现很多的论文都用到了attentive moudule。这也得益于越来越多的实验证明自注意力机制对于：什么是重要的？这个问题的合理解决。相比传统的直接生成特征图，对于每一个item进行同样的卷积提取特征等操作，让神经网络来自己学习哪部分是前景，哪部分是背景噪声，不重要，加入一个attentive module是一个很聪明的办法。现在学术界涌现出许多的attentive module的设计方法，主要还是应用在2d目标检测领域。这篇博客主要是对于一些开源的影响力大的模块进行一个介绍。 CM

正则多关键字_今日论文|清华：多视图远程关系抽取&谷歌：深度核分类层&NLP领域持续学习综述&用于可靠文本分类的掩码关键字正则化&MORE...

weixin_39583623的博客

12-19

2450

12月18日人工智能领域新增论文267篇，AI日读精选其中79篇推荐给大家。这些论文主要来自AAAI，BIBM，COLING，CVPR，Computational Intelligence，ECIR，EMNLP，Evolutionary Computation，ICRA，IJCV，Information Systems，NeurIPS，WACV等会议与期刊。其中包含计算机视觉论文28篇[...

【论文笔记】基于预训练模型的持续学习（Continual Learning）（增量学习，Incremental Learning）

qq_43456016的博客

04-21

7051

持续学习（Continual Learning, CL）旨在使模型在学习新知识的同时能够保留原来的知识信息了，然而现实任务中，模型并不能很好地保留原始信息，这也就是常说的灾害性遗忘（Catastrophic forgetting）问题。传统的CL方法需要从头开始训练模型（从随机初始化参数开始训练），目前基于大规模数据训练得到的预训练模型为持续学习带来了新的研究思路，预训练模型鲁棒的泛化性给予新任务学习较为成熟的参数，也因此基于预训练模型的CL方法已逐渐成为研究热点。

期望最大化注意力网络 EMANet

年轻即出发，

06-28

5574

论文提出的期望最大化注意力机制Expectation- Maximization Attention (EMA)，摒弃了在全图上计算注意力图的流程，转而通过期望最大化（EM）算法迭代出一组紧凑的基，在这组基上运行注意力机制，从而大大降低了复杂度。X表示观测数据，Z表示隐变量空间，每一个数据x都有相应的隐变量与其对应，{X,Z}称为完整的数据，其极大似然估计就是lnp(X，Z|q)，q表示模型的参数。通过注意力可视化图，i，j，k，l表示四个随机选择的基的下标,右边四列绘出的是它们各自对应的注意力图。

CVPR2019论文列表（中英对照）

dovings的博客

07-04

1万+

CVPR论文列表，中英对照

Multi-scale spatial pyramid attention mechanism for image recognition: An effective approach

12-28

### 多尺度空间金字塔注意力机制的有效方法 #### 关键概念解析多尺度空间金字塔注意力机制通过引入不同尺度的感受野来捕捉图像中的特征，从而提高模型对复杂场景的理解能力。这种机制通常结合卷积神经网络（CNN），利用多个分支处理同一输入的不同分辨率版本。 #### 实现细节为了有效地应用多尺度空间金字塔注意力机制，在每个块级别计算来自各个分支生成的特征图加权平均值[^1]。权重由学习到的标量参数决定，这些参数指示相对于其他映射而言应关注的程度。此过程允许模型自适应地聚焦于重要的局部区域，而忽略不那么相关的部分。对于具体实现方式之一——CBAM模块，则进一步区分了通道维度上的注意力建模以及空间位置上的建模，并且两者之间采用串联结构依次执行[^2]。值得注意的是，在实际操作过程中，可以同时运用最大池化与均值池化的策略获取全局上下文信息。此外，当涉及到语义分割任务时，有研究指出使用硬标签而非软标签能够提升存储效率及训练速度[^4]。这意味着尽管某些情况下可能损失了一定程度的概率分布表达力，但在特定应用场景下依然可以获得性能优势。 ```python import torch.nn as nn class MultiScaleSpatialPyramidAttention(nn.Module): def __init__(self, channels): super(MultiScaleSpatialPyramidAttention, self).__init__() # 定义不同的感受野大小 self.branches = nn.ModuleList([ nn.Conv2d(channels, channels, kernel_size=3, padding=dilation, dilation=dilation) for dilation in [1, 2, 4] ]) def forward(self, x): attentions = [] for branch in self.branches: atten_map = branch(x).sigmoid() attentions.append(atten_map * x) out = sum(attentions) / len(attentions) return out ```