评价此页

torch.nn.functional.interpolate#

torch.nn.functional.interpolate(input, size=None, scale_factor=None, mode='nearest', align_corners=None, recompute_scale_factor=None, antialias=False)[source]#

对输入进行下采样/上采样。

Tensor 将插值到给定的 size 或给定的 scale_factor

用于插值的算法由 mode 决定。

目前支持时间、空间和体积采样,即期望的输入形状为 3-D、4-D 或 5-D。

输入维度按以下形式解释:mini-batch x channels x [可选深度] x [可选高度] x 宽度

可用的重采样模式有:nearestlinear(仅限 3D)、bilinearbicubic(仅限 4D)、trilinear(仅限 5D)、areanearest-exact

参数
  • input (Tensor) – 输入张量

  • size (intTuple[int] 或 Tuple[int, int] 或 Tuple[int, int, int]) – 输出空间大小。

  • scale_factor (floatTuple[float]) – 空间尺寸的乘数。如果 scale_factor 是一个元组,其长度必须与空间维度的数量匹配;input.dim() - 2

  • mode (str) – 上采样所用的算法:'nearest' | 'linear' | 'bilinear' | 'bicubic' | 'trilinear' | 'area' | 'nearest-exact'。默认为 'nearest'

  • align_corners (bool, optional) – 在几何上,我们将输入和输出的像素视为正方形而不是点。如果设置为 True,则输入和输出张量通过其角像素的中心点对齐,保留角像素的值。如果设置为 False,则输入和输出张量通过其角像素的角点对齐,并且插值使用边缘值填充超出边界的值,这使得此操作与输入尺寸*无关*(当 scale_factor 保持不变时)。这仅在 mode'linear''bilinear''bicubic''trilinear' 时才有影响。默认为 False

  • recompute_scale_factor (bool, optional) – 重新计算用于插值计算的 scale_factor。如果 recompute_scale_factorTrue,则必须传入 scale_factor,并且 scale_factor 用于计算输出 size。计算出的输出 size 将用于推断插值的新比例。请注意,当 scale_factor 是浮点数时,由于舍入和精度问题,它可能与重新计算的 scale_factor 不同。如果 recompute_scale_factorFalse,则 sizescale_factor 将直接用于插值。默认为 None

  • antialias (bool, optional) – 应用抗锯齿的标志。默认为 False。将抗锯齿选项与 align_corners=False 一起使用,对于下采样操作,插值结果将与 Pillow 结果匹配。支持的模式:'bilinear''bicubic'

返回类型

张量

注意

使用 mode='bicubic' 时,可能会引起过冲。对于某些 dtype,对于图像可能会产生负值或大于 255 的值。如果要减少显示图像时的过冲,请显式调用 result.clamp(min=0,max=255)。对于 uint8 输入,它已经执行了饱和转换操作。因此,不需要手动进行 clamp 操作。

注意

模式 mode='nearest-exact' 匹配 Scikit-Image 和 PIL 的最近邻插值算法,并修复了 mode='nearest' 的已知问题。引入此模式是为了保持向后兼容性。模式 mode='nearest' 匹配有 bug 的 OpenCV 的 INTER_NEAREST 插值算法。

注意

在使用 ['linear', 'bilinear', 'bicubic', 'trilinear', 'area'] 模式时,CUDA 上 float16 类型的梯度在 Upsample 操作中可能不准确。有关更多详细信息,请参阅 issue#104157 中的讨论。

注意

此操作在使用 CUDA 设备上的张量时可能会产生非确定性梯度。有关更多信息,请参阅 可复现性