pytorch的conv和bn融合

### PyTorch 中 Conv 和 BN 层的融合方法在深度学习模型优化过程中，将卷积层（Conv）和批量归一化层（Batch Normalization, BN）进行融合是一种常见的推理加速技术。通过这种融合可以减少计算开销并提高运行效率。以下是具体实现方式： #### 1. 数学原理 BN 的前向传播公式如下所示： \[ y = \gamma \cdot \frac{x - \mu}{\sqrt{\sigma^2 + \epsilon}} + \beta \] 其中 \( x \) 是输入张量，\( \mu \) 和 \( \sigma^2 \) 分别是均值和方差，而 \( \gamma \) 和 \( \beta \) 则是可训练参数[^4]。对于 Conv 层来说，其输出形式为： \[ z = W \ast x + b \] 当我们将 BN 应用于 Conv 输出时，最终的结果可以通过重新定义权重和偏置来表示为一个新的 Conv 操作： \[ z' = (W' \ast x) + b' \] 这里， \[ W' = \gamma \cdot \frac{W}{\sqrt{\sigma^2 + \epsilon}}, \quad b' = \beta - \gamma \cdot \frac{\mu}{\sqrt{\sigma^2 + \epsilon}} + b \][^3]. #### 2. Python 实现代码下面是一个简单的 PyTorch 实现示例，展示如何手动完成 Conv 和 BN 层的融合操作： ```python import torch.nn as nn import numpy as np def fuse_conv_and_bn(conv: nn.Conv2d, bn: nn.BatchNorm2d): """ 将 Conv 和 BN 层融合成新的 Conv 层。参数: conv (nn.Conv2d): 卷积层实例。 bn (nn.BatchNorm2d): 批量归一化层实例。返回: 新的融合后的 Conv 层。 """ fusedconv = nn.Conv2d( in_channels=conv.in_channels, out_channels=conv.out_channels, kernel_size=conv.kernel_size, stride=conv.stride, padding=conv.padding, bias=True ) with torch.no_grad(): # 提取权重量化参数 w_conv = conv.weight.clone().view(conv.out_channels, -1) w_bn = torch.diag(bn.weight.div(torch.sqrt(bn.running_var + bn.eps))) b_conv = conv.bias.clone() if conv.bias is not None else torch.zeros(conv.weight.size(0)) b_bn = bn.bias - bn.weight.mul(bn.running_mean).div(torch.sqrt(bn.running_var + bn.eps)) # 更新融合后的权重和偏差 fusedconv.weight.copy_((w_bn @ w_conv).view(fusedconv.weight.shape)) fusedconv.bias.copy_(b_bn + (w_bn @ b_conv.view(-1)).view(-1)) return fusedconv ``` 上述函数 `fuse_conv_and_bn` 接受两个模块作为输入——一个 Conv2D 和一个 BatchNorm2D，并返回一个新的 Conv2D 模块，该模块已经包含了原始 Conv 和 BN 的功能[^2]。 #### 3. 使用 FX 自动融合 PyTorch 1.10 引入了一个名为 `FX` 的工具包，它能够更方便地处理图级别的变换，比如自动识别和融合 Conv-BN 对。这种方法无需手动编写复杂的逻辑，而是依赖于框架内部的支持。以下是如何使用 FX 进行自动化融合的一个简单例子： ```python from torch.fx import symbolic_trace from torch.quantization.fuse_modules import fuse_known_modules model = YourModel() traced_model = symbolic_trace(model) fused_graph = [] for node in traced_model.graph.nodes: if node.op == 'call_module': target = str(node.target) submod = getattr(traced_model, target) if isinstance(submod, nn.Sequential): modules_to_fuse = list(submod.children()) fused_mod = fuse_known_modules(modules_to_fuse) setattr(traced_model, target, nn.Sequential(*fused_mod)) traced_model.recompile() ``` 此脚本会遍历整个网络结构，找到所有可能的 Conv-BN 组合并对它们执行融合操作。 --- ###

阅读全文

pytorch的conv和bn融合

相关推荐

pytorch之添加BN的实现

浅谈pytorch中的BN层的注意事项

pytorch中nn.Conv1d的用法详解

CONV-BN-ReLU融合

深度学习优化算法：PyTorch实现与理论的完美融合

utils.fuse_all_conv_bn

目标识别里CBS模块是干什么的？conv，bn，silu起什么作用？

DCA特征融合的pytorch代码实现

pytorch CSP

使用pytorch如何将resnet50第三层特征和第四层特征融合

psa模块融合深度可分离卷积的pytorch代码

基于pytorch将TCN-bigru-attention与resnet融合

AttributeError: module 'torch.utils' has no attribute 'fuse_conv_and_bn'

BN层和卷积层的融合

BiFPN pytorch代码

大家在看

android获取屏幕分辨率实现

Sample_Note_article_for_RSI_2_8.doc

IndCal.rar

Verilog LRM

十几种水下图像增强算法源代码

最新推荐

婚纱摄影公司网络推广人员工作绩效说明.docx

VC图像编程全面资料及程序汇总

Pokemmo响应速度翻倍：多线程处理的高级技巧

人名列表滚动抽奖

一站式JSF开发环境：即解压即用JAR包

Pokemmo内存优化揭秘：专家教你如何降低50%资源消耗

直接访问子路由是吧

C++函数库查询辞典使用指南与功能介绍

【bat脚本安全最佳实践】：保护你的系统与脚本安全的黄金法则

IIC抽电