评价此页

MaxPool1d#

class torch.nn.MaxPool1d(kernel_size, stride=None, padding=0, dilation=1, return_indices=False, ceil_mode=False)[source]#

对由多个输入平面组成的输入信号应用 1D 最大池化。

在最简单的情况下,具有输入大小 (N,C,L)(N, C, L) 的层,输出为 (N,C,Lout)(N, C, L_{out}) 的值可以精确地描述为

out(Ni,Cj,k)=maxm=0,,kernel_size1input(Ni,Cj,stride×k+m)out(N_i, C_j, k) = \max_{m=0, \ldots, \text{kernel\_size} - 1} input(N_i, C_j, stride \times k + m)

如果 padding 非零,则输入两侧将隐式填充负无穷,填充长度为 paddingdilation 是滑动窗口内元素之间的步长。此 链接 对池化参数有很好的可视化。

注意

当 ceil_mode=True 时,如果滑动窗口从左侧填充或输入开始,则允许它们超出边界。从右侧填充区域开始的滑动窗口将被忽略。

参数
  • kernel_size (Union[int, tuple[int]]) – 滑动窗口的大小,必须大于 0。

  • stride (Union[int, tuple[int]]) – 滑动窗口的步长,必须大于 0。默认值为 kernel_size

  • padding (Union[int, tuple[int]]) – 需要添加到两侧的隐式负无穷填充,必须大于等于 0 且小于等于 kernel_size / 2。

  • dilation (Union[int, tuple[int]]) – 滑动窗口内元素的步长,必须大于 0。

  • return_indices (bool) – 如果为 True,将返回最大值的索引以及最大值。这对于之后使用 torch.nn.MaxUnpool1d 很有用

  • ceil_mode (bool) – 如果为 True,将使用 ceil 而不是 floor 来计算输出形状。这确保了输入张量中的每个元素都被滑动窗口覆盖。

形状
  • 输入:(N,C,Lin)(N, C, L_{in})(C,Lin)(C, L_{in})

  • 输出:(N,C,Lout)(N, C, L_{out})(C,Lout)(C, L_{out})

    其中 ceil_mode = False

    Lout=Lin+2×paddingdilation×(kernel_size1)1stride+1L_{out} = \left\lfloor \frac{L_{in} + 2 \times \text{padding} - \text{dilation} \times (\text{kernel\_size} - 1) - 1}{\text{stride}}\right\rfloor + 1

    其中 ceil_mode = True

    Lout=Lin+2×paddingdilation×(kernel_size1)1+(stride1)stride+1L_{out} = \left\lceil \frac{L_{in} + 2 \times \text{padding} - \text{dilation} \times (\text{kernel\_size} - 1) - 1 + (stride - 1)}{\text{stride}}\right\rceil + 1
  • 确保最后一个池化操作开始在图像内部,当 (Lout1)stride>=Lin+padding(L_{out} - 1) * \text{stride} >= L_{in} + \text{padding} 时,将 Lout=Lout1L_{out} = L_{out} - 1

示例

>>> # pool of size=3, stride=2
>>> m = nn.MaxPool1d(3, stride=2)
>>> input = torch.randn(20, 16, 50)
>>> output = m(input)