评价此页

LPPool3d#

class torch.nn.LPPool3d(norm_type, kernel_size, stride=None, ceil_mode=False)[source]#

对由多个输入平面组成的输入信号应用 3D 幂平均池化。

在每个窗口上,计算的函数为

f(X)=xXxppf(X) = \sqrt[p]{\sum_{x \in X} x^{p}}
  • 当 p = \infty 时,得到最大池化(Max Pooling)。

  • 当 p = 1 时,得到和池化(Sum Pooling)(与平均池化成比例)。

参数 kernel_sizestride 可以是

  • 单个 int — 在这种情况下,高度、宽度和深度维度都使用相同的值。

  • 一个 tuple,包含三个整数 — 在这种情况下,第一个整数用于深度维度,第二个整数用于高度维度,第三个整数用于宽度维度。

注意

如果求和的 p 次方为零,则该函数的梯度未定义。此实现将在这种情况下将梯度设置为零。

参数
  • kernel_size (Union[int, tuple[int, int, int]]) – 窗口的大小。

  • stride (Union[int, tuple[int, int, int]]) – 窗口的步长。默认值为 kernel_size

  • ceil_mode (bool) – 如果为 True,则使用 ceil 而不是 floor 来计算输出形状。

形状
  • 输入:(N,C,Din,Hin,Win)(N, C, D_{in}, H_{in}, W_{in})(C,Din,Hin,Win)(C, D_{in}, H_{in}, W_{in})

  • 输出:(N,C,Dout,Hout,Wout)(N, C, D_{out}, H_{out}, W_{out}) 或者 (C,Dout,Hout,Wout)(C, D_{out}, H_{out}, W_{out}),其中

    Dout=Dinkernel_size[0]stride[0]+1D_{out} = \left\lfloor\frac{D_{in} - \text{kernel\_size}[0]}{\text{stride}[0]} + 1\right\rfloor
    Hout=Hinkernel_size[1]stride[1]+1H_{out} = \left\lfloor\frac{H_{in} - \text{kernel\_size}[1]}{\text{stride}[1]} + 1\right\rfloor
    Wout=Winkernel_size[2]stride[2]+1W_{out} = \left\lfloor\frac{W_{in} - \text{kernel\_size}[2]}{\text{stride}[2]} + 1\right\rfloor

示例

>>> # power-2 pool of square window of size=3, stride=2
>>> m = nn.LPPool3d(2, 3, stride=2)
>>> # pool of non-square window of power 1.2
>>> m = nn.LPPool3d(1.2, (3, 2, 2), stride=(2, 1, 2))
>>> input = torch.randn(20, 16, 50, 44, 31)
>>> output = m(input)