dropout和正则化的区别和详解

dropout和dropblock都是防止过拟合的方法，但是具体实现和效果略有不同。dropout是将一部分神经元按照一定概率随机去掉，不参与当前的正向传播和反向传播，从而减少神经元之间的相互依赖，让网络更具有泛化性。而dropblock是在特征层级上随机去掉一定区域的特征，相当于对特征进行粗粒度的屏蔽，从而增加了特征之间的独立性，减少过拟合。相比之下，dropblock更适用于高分辨率图像的任务，而dropout更适用于较小的网络和自然语言处理任务。

在实验中，将数据进行正则化在输入到batch normalization。ST-GCN模型由九层时空图卷积组成。前三层输出64通道数，中间三层输出128通道，最后三层输出256层通道数。一共有9个时间卷积核，在每一个ST-GCN使用残差链接，使用dropout进行特征正则化处理，将一半的神经元进行dropout处理。第4、7层的时间卷积层设置为poling层。最后将输出的256个通道数的输出进行全局pooling,并由softmax进行分类。是由SGD进行优化

### ST-GCN 模型架构详解 #### 正则化与 Batch Normalization 的应用 ST-GCN（Spatio-Temporal Graph Convolutional Network）是一种针对时空数据建模的深度学习框架，广泛应用于动作识别等领域。为了提高模型稳定性并减少过拟合现象，Batch Normalization 被引入每一层卷积操作之后[^3]。具体而言，BN 层通过标准化激活函数前的输入值来加速收敛过程，并缓解梯度消失或爆炸问题。此外，Dropout 技术也被采用作为一种显式的正则化手段。通常情况下，在全连接层之前会加入一定比例的 Dropout 来随机丢弃部分神经元，从而增强泛化能力[^4]。 #### 各层通道数的设计原理关于通道数设置方面，一般遵循从小到大逐渐增加的原则。例如初始几层可能设定为64个滤波器，随后逐步提升至128甚至更高如256等数值。这种渐增模式有助于先提取低级局部特征再过渡向更高级别的抽象表达形式。这样的设计可以有效捕捉不同尺度下的空间与时序关联特性。 #### 时间卷积核数量对于时间维度上的处理，则主要依赖一维卷积运算完成。这些卷积核负责沿着时间轴滑动扫描节点间相互作用规律。其大小往往依据实验效果调整优化得出最佳参数组合。 #### Residual Connection 实现方式残差连接允许较深网络仍能保持良好性能表现的关键因素之一就是它解决了深层网络训练过程中可能出现的退化解难题。在实际编码实现当中可以通过简单加法操作将未经变换或者仅经过线性投影转换过的原始输入叠加回最终输出端口处达成目标。 #### Pooling Layer 配置详情池化层主要用于降低特征地图的空间分辨率进而达到降维目的同时保留最重要信息成分不丢失过多细节内容。按照惯例会在特定层次比如第四七两阶段安排相应操作步骤执行最大值选取策略(Max-Pooling)。 #### 全局平均池化(Global Average Pooling) 及 Softmax 分类环节说明当所有先前预处理完毕后进入最后决策判断时刻时,全局平均池化将会把整个序列压缩成固定长度表示向量供后续SoftMax分类器利用计算各类别概率分布情况以便做出最有可能的选择结果. #### 优化方法(SGD Optimizer Usage) 至于求解算法选择上，默认推荐使用带momentum项的标准随机梯度下降法(Stochastic Gradient Descent with Momentum),因为它具备较快收敛速度又能较好避开局部极小点陷阱的优势特点. ```python import torch.nn as nn class Model(nn.Module): def __init__(self): super(Model,self).__init__() self.st_gcn_networks = nn.Sequential( st_gcn(in_channels=3,out_channels=64,kernel_size=(9,1)), ... st_gcn(in_channels=128,out_channels=256,kernel_size=(9,1)) ) self.fc = nn.Linear(256,num_class) def forward(self,x): out = self.st_gcn_networks(x) out = F.avg_pool2d(out,(1,T)) # Global average pooling over time dimension T. out = out.view(N,-1) predict_score = self.fc(out) return predict_score ```

阅读全文

dropout和正则化的区别和详解

相关推荐

正则化方法在机器学习的应用及实现详解

吴恩达深度学习超参数调制完整程序（无正则化、L2正则化及Dropout）

精准制导：正则化技术在提升YOLO模型性能中的应用

深度学习正则化详解：L2与Dropout

【进阶】正则化方法：Dropout详解

深度学习中的正则化技术：Dropout与L1_L2正则化

【关键超参数详解】正则化参数：防止过拟合的L1、L2和Dropout技术

深度学习正则化详解：L1与L2，防止过拟合

机器学习中的过拟合与正则化技术详解

Keras动态正则化技术实现与应用详解

Pytorch CutMix正则化技术与项目源码详解

深度学习中的正则化技术详解

卷积神经网络中的正则化技术详解

【正则化技术】：L1和L2正则化在房价预测中的实战运用

正则化技术详解：有效解决偏差-方差问题的策略

Keras正则化技术应用：L1_L2与Dropout的深入理解

【Dropout变种技术】：Matlab实现的其他正则化技术探索

深度学习进阶秘籍：中文版算法优化与正则化技术详解

【防止过拟合策略】：梯度下降中的正则化技术详解

大家在看

WIN2003网卡驱动.

AMIDE-开源

system verilog for design 2nd edition

华为逆变器SUN2000-(33KTL, 40KTL) MODBUS接口定义描述

矢量版陕西省镇界、乡镇边界、乡镇行政区

最新推荐

(完整版)网络大集体备课的心得与体会(最新整理).pdf

2.2-导数的基本公式与运算法则省名师优质课赛课获奖课件.ppt

098L产品网络推广策略.pptx

前端分析-202307110078988

1.1.1算法的概念（一）.doc

构建基于ajax, jsp, Hibernate的博客网站源码解析

【Unity Sunny Land关卡设计高级指南】：打造完美关卡的8大技巧

C++ 模版

C#随机数摇奖系统功能及隐藏开关揭秘

【数据驱动的力量】：管道缺陷判别方法论与实践经验