PyTorch中池化层的padding和ceil_mode参数设置

最新推荐文章于 2024-05-10 16:32:37 发布

Stoneplay26

最新推荐文章于 2024-05-10 16:32:37 发布

阅读量5.2k

点赞数 2

CC 4.0 BY-SA版权

分类专栏： PyTorch 文章标签： pytorch

本文链接：https://blog.csdn.net/qq_28753373/article/details/104985341

PyTorch 专栏收录该内容

12 篇文章

订阅专栏

本文详细解析了PyTorch中池化操作的参数设置，包括padding、ceil_mode和count_include_pad对输出特征图大小的影响，以及如何通过调整这些参数实现特定的输出尺寸。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在池化操作的接口中，padding和ceil_mode这两个参数会影响到输出特征图的大小。padding即对特征图大小进行扩充的像素数量；ceil_mode指明，当剩余的像素不足滤波器大小，是否仍对这些像素进行运算。
对于池化操作来说，当stride为1时，希望输出与输入保持不变；当stride为2时，希望输出特征图的宽高均为输入的一半。下面以avg_pool2d讲解如何尽量简单达到上述目的：

import torch
import torch.nn.functional as f

y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=False)) # tensor([[[[3]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 6, 4]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=False)) # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=0, ceil_mode=True))  # tensor([[[[3, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=True))  # tensor([[[[2, 3, 6, 4]]]])

stride=2时：
若padding为0，则padding后仍为[1, 5, 4, 9]。第一次运算对[1, 5, 4]进行，得到3（向下取整）；由于stride=2，则第二次运算只剩[4, 9]这一个像素，小于kernel_size，此时，若ceil_mode=False，则直接不对剩余的部分运算，因此输出大小为1；若ceil_mode=True，则对剩余部分继续计算，取[4, 9]的均值6（向下取整），因此输出大小为2。若padding=1，PyTorch的默认padding值为0，则该维度上padding后为[0, 1, 5, 4, 9, 0]，ceil_mode=False时，输出为[2, 6]；ceil_mode=True时，输出为[2, 6, 4]。

stride=1时：
若padding=0，则输出为[3, 6]；若padding=1，输入为[0, 1, 5, 4, 9, 0]，输出为[2, 3, 6, 4]。stride=1时，ceil_mode的值不起作用，始终为False。

总结：

stride=2，padding=1或ceil__mode=True；stride=1时，必须有padding=1，ceil_mode的设置不起作用。

推广：

ceil_mode始终保持PyTorch的默认值False，且padding始终为kernel_size // 2。

PyTorch中池化操作还有一个与padding有关的参数count_include_pad，默认为True。意义是在运算（比如计算平均值或最大值）时，始终将padding的值纳入计算。

import torch
import torch.nn.functional as f
y = torch.tensor([[[[1,5,4,9]]]])

print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 6]]]])
print(f.avg_pool2d(y, (1, 3), stride=2, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 6]]]])

print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), ceil_mode=False)) # tensor([[[[2, 3, 6, 4]]]])
print(f.avg_pool2d(y, (1, 3), stride=1, padding=(0, 1), count_include_pad=False, ceil_mode=False)) # tensor([[[[3, 3, 6, 4]]]])