快捷方式

RandomResizedCrop

class torchvision.transforms.RandomResizedCrop(size, scale=(0.08, 1.0), ratio=(0.75, 1.3333333333333333), interpolation=InterpolationMode.BILINEAR, antialias: Optional[bool] = True)[source]

随机裁剪图像的一部分并将其调整到给定大小。

如果图像是 torch Tensor,则期望其形状为 […, H, W],其中 … 表示任意数量的前导维度

会裁剪原始图像的一部分:裁剪的区域(H * W)和长宽比是随机的。最后将此裁剪区域调整到给定大小。这通常用于训练 Inception 网络。

参数:
  • size (int序列) –

    期望的裁剪输出大小,按边缘。如果 size 是一个整数而不是序列(如 (h, w)),则将创建一个正方形输出尺寸 (size, size)。如果提供长度为 1 的序列,它将被解释为 (size[0], size[0])。

    注意

    在 torchscript 模式下,不支持将 size 作为单个整数,请使用长度为 1 的序列:[size, ]

  • scale (tuple of python:float) – 指定裁剪前的随机区域的下界和上界。尺度相对于原始图像的面积定义。

  • ratio (tuple of python:float) – 裁剪前的随机长宽比的下界和上界。

  • interpolation (InterpolationMode) – 由 torchvision.transforms.InterpolationMode 定义的期望的插值枚举。默认为 InterpolationMode.BILINEAR。如果输入是 Tensor,仅支持 InterpolationMode.NEARESTInterpolationMode.NEAREST_EXACTInterpolationMode.BILINEARInterpolationMode.BICUBIC。也接受相应的 Pillow 整数常量,例如 PIL.Image.BILINEAR

  • antialias (bool, 可选) –

    是否应用抗锯齿。它仅影响双线性或双三次模式下的**张量**,否则将被忽略:对于 PIL 图像,双线性或双三次模式下的抗锯齿始终被应用;对于其他模式(PIL 图像和张量),抗锯齿没有意义,此参数将被忽略。可能的值为

    • True (默认):将对双线性或双三次模式应用抗锯齿。其他模式不受影响。这可能是您想要使用的。

    • False:将不对任何模式下的张量应用抗锯齿。PIL 图像在双线性或双三次模式下仍然进行抗锯齿处理,因为 PIL 不支持无抗锯齿。

    • None:对于张量等同于 False,对于 PIL 图像等同于 True。此值是出于历史原因而存在的,除非您真正知道自己在做什么,否则您可能不想使用它。

    默认值在 v0.17 中从 None 更改为 True,以使 PIL 和 Tensor 后端保持一致。

使用 RandomResizedCrop 的示例

如何编写自己的 v2 变换

如何编写自己的 v2 变换

如何使用 CutMix 和 MixUp

如何使用 CutMix 和 MixUp

变换 v2 入门

变换 v2 入门

转换图示

转换图示
forward(img)[source]
参数:

img (PIL ImageTensor) – 要裁剪和调整大小的图像。

返回:

随机裁剪并调整大小后的图像。

返回类型:

PIL 图像或张量

static get_params(img: Tensor, scale: list[float], ratio: list[float]) tuple[int, int, int, int][source]

获取用于随机尺寸裁剪的 crop 参数。

参数:
  • img (PIL ImageTensor) – 输入图像。

  • scale (list) – 从原始尺寸裁剪的范围

  • ratio (list) – 从原始长宽比裁剪的长宽比范围

返回:

用于随机尺寸裁剪的 crop 的参数 (i, j, h, w)。

返回类型:

元组

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源