FractionalMaxPool2d#
- class torch.nn.FractionalMaxPool2d(kernel_size, output_size=None, output_ratio=None, return_indices=False, _random_samples=None)[source]#
对输入信号进行2D分数最大池化,该输入信号由多个输入平面组成。
分数最大池化在论文 Fractional MaxPooling 中由 Ben Graham 进行了详细描述。
最大池化操作在 区域上进行,步长由目标输出尺寸确定的随机步长决定。输出特征的数量等于输入平面的数量。
注意
必须定义
output_size
或output_ratio
中的一个且仅一个。- 参数
kernel_size (Union[int, tuple[int, int]]) – 用于取最大值的窗口大小。可以是单个数字 k(用于 k x k 的方形窗口)或元组 (kh, kw)
output_size (Union[int, tuple[int, int]]) – 图像的目标输出尺寸,形式为 oH x oW。可以是元组 (oH, oW) 或单个数字 oH(用于方形图像 oH x oH)。请注意,必须满足 and
output_ratio (Union[float, tuple[float, float]]) – 如果希望输出大小是输入大小的比例,则可以给出此选项。这必须是范围在 (0, 1) 内的数字或元组。请注意,我们必须有 and
return_indices (bool) – 如果设置为
True
,则会返回输出的索引。这对于传递给nn.MaxUnpool2d()
非常有用。默认为False
。
- 形状
输入: 或 。
输出: 或 ,其中 或 。
示例
>>> # pool of square window of size=3, and target output size 13x12 >>> m = nn.FractionalMaxPool2d(3, output_size=(13, 12)) >>> # pool of square window and target output size being half of input image size >>> m = nn.FractionalMaxPool2d(3, output_ratio=(0.5, 0.5)) >>> input = torch.randn(20, 16, 50, 32) >>> output = m(input)