什么是上采样和下采样

胡乱儿起个名

已于 2025-04-15 15:51:35 修改

阅读量8.2k

点赞数 15

CC 4.0 BY-SA版权

分类专栏：深度学习基础文章标签：深度学习机器学习神经网络

于 2024-02-27 23:08:01 首次发布

本文链接：https://blog.csdn.net/qq_44815135/article/details/136333958

深度学习基础专栏收录该内容

11 篇文章

订阅专栏

本文介绍了卷积神经网络中上采样（如反卷积和插值）用于增加特征图分辨率的方法，以及下采样（如最大池化）用于减小尺寸并提升特征平移不变性的过程，强调了这些操作在模型效率和防止过拟合中的作用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

卷积神经网络（CNN）中的**上采样（Upsampling）和下采样（Downsampling）**是调整特征图空间分辨率的关键操作，分别用于增大或减小特征图的尺寸。它们在图像分割、超分辨率、目标检测等任务中广泛应用。以下是详细解释和示例：

1. 下采样（Downsampling）

目的：降低特征图的分辨率，减少计算量，同时扩大感受野，提取更高层次的语义特征。
常见方法：

池化（Pooling）：最大池化（Max Pooling）、平均池化（Average Pooling）。
跨步卷积（Strided Convolution）：卷积步长（stride）>1时，直接缩小特征图尺寸。
空间金字塔池化（SPP）：多尺度池化。

例子：
假设输入是一个4×4的特征图，通过2×2最大池化（步长2）：

输入：
[[1, 2, 3, 4],
 [5, 6, 7, 8],
 [9,10,11,12],
 [13,14,15,16]]

最大池化后（2×2窗口）：
[[6, 8],   # max(1,2,5,6)=6, max(3,4,7,8)=8
 [14,16]]  # max(9,10,13,14)=14, max(11,12,15,16)=16

输出为2×2的特征图，分辨率降低但保留了局部最显著的特征。

2. 上采样（Upsampling）

目的：增大特征图的分辨率，恢复空间细节，常用于图像重建或分割任务。
常见方法：

转置卷积（Transposed Convolution）：通过可学习的参数插值（如反卷积）。
插值法：最近邻插值（Nearest Neighbor）、双线性插值（Bilinear）。
像素洗牌（Pixel Shuffle）：通道重组提升分辨率（如ESPCN）。

例子：
(1) 最近邻插值：将2×2输入上采样2倍到4×4：

输入：
[[1, 2],
 [3, 4]]

最近邻插值（每个像素复制到2×2区域）：
[[1,1, 2,2],
 [1,1, 2,2],
 [3,3, 4,4],
 [3,3, 4,4]]

(2) 转置卷积：
假设输入为2×2，使用3×3卷积核（stride=1, padding=1），通过填充和卷积操作生成更大的输出。具体计算过程较复杂，涉及填充输入后卷积。

3. 典型应用场景

下采样：
- VGG、ResNet等分类网络中，通过池化或跨步卷积逐步压缩特征图。
- 目标检测（如Faster R-CNN）中减少RoI区域的计算量。
上采样：
- U-Net、SegNet等分割网络中，通过转置卷积或插值恢复分辨率。
- 超分辨率（如SRCNN）中从低分辨率重建高分辨率图像。

4. 关键区别

特性	下采样	上采样
目的	压缩尺寸，提取高层特征	恢复尺寸，保留空间细节
操作类型	池化、跨步卷积	转置卷积、插值
信息损失	可能丢失细节（如池化）	可能引入伪影（如反卷积）
典型位置	编码器（Encoder）	解码器（Decoder）

5. 代码示例（PyTorch）

import torch
import torch.nn as nn

# 下采样：最大池化
downsample = nn.MaxPool2d(kernel_size=2, stride=2)
input = torch.rand(1, 1, 4, 4)  # 4x4输入
output = downsample(input)       # 输出2x2

# 上采样：转置卷积
upsample = nn.ConvTranspose2d(1, 1, kernel_size=2, stride=2)
input = torch.rand(1, 1, 2, 2)   # 2x2输入
output = upsample(input)         # 输出4x4