快捷方式

RandomAffine

class torchvision.transforms.v2.RandomAffine(degrees: Union[Number, Sequence], translate: Optional[Sequence[float]] = None, scale: Optional[Sequence[float]] = None, shear: Optional[Union[int, float, Sequence[float]]] = None, interpolation: Union[InterpolationMode, int] = InterpolationMode.NEAREST, fill: Union[int, float, Sequence[int], Sequence[float], None, dict[Union[type, str], Union[int, float, collections.abc.Sequence[int], collections.abc.Sequence[float], NoneType]] = 0, center: Optional[list[float]] = None)[源代码]

随机仿射变换,保持中心不变。

如果输入是 torch.TensorTVTensor(例如 ImageVideoBoundingBoxes 等),它可以具有任意数量的前导批处理维度。例如,图像的形状可以是 [..., C, H, W]。边界框的形状可以是 [..., 4]

参数:
  • degrees (sequencenumber) – 用于选择的度数范围。如果 degrees 是一个数字而不是序列(例如 (min, max)),则度数范围将是 (-degrees, +degrees)。设置为 0 可禁用旋转。

  • translate (tuple, optional) – 水平方向和垂直方向的最大绝对分数。例如,translate=(a, b),则水平偏移随机采样于范围 -img_width * a < dx < img_width * a,垂直偏移随机采样于范围 -img_height * b < dy < img_height * b。默认情况下不进行平移。

  • scale (tuple, optional) – 缩放因子区间,例如 (a, b),则缩放因子随机采样于范围 a <= scale <= b。默认情况下将保持原始缩放。

  • shear (sequencenumber, optional) – 用于选择的度数范围。如果 shear 是一个数字,则沿 x 轴方向在 (-shear, +shear) 范围内应用剪切。否则,如果 shear 是一个包含 2 个值的序列,则沿 x 轴方向在 (shear[0], shear[1]) 范围内应用剪切。否则,如果 shear 是一个包含 4 个值的序列,则沿 x 轴方向在 (shear[0], shear[1]) 范围内应用剪切,沿 y 轴方向在 (shear[2], shear[3]) 范围内应用剪切。默认情况下不应用剪切。

  • interpolation (InterpolationMode, optional) – 由 torchvision.transforms.InterpolationMode 定义的所需插值枚举。默认为 InterpolationMode.NEAREST。如果输入是 Tensor,则仅支持 InterpolationMode.NEARESTInterpolationMode.BILINEAR。也可以接受相应的 Pillow 整数常量,例如 PIL.Image.BILINEAR

  • fill (numbertupledict, optional) – 当 padding_mode 为 constant 时使用的像素填充值。默认为 0。如果是一个长度为 3 的元组,它将分别用于填充 R、G、B 通道。填充值也可以是字典,映射数据类型到填充值,例如 fill={tv_tensors.Image: 127, tv_tensors.Mask: 0},其中 Image 将填充为 127,Mask 将填充为 0。

  • center (sequence, 可选) – 可选的旋转中心,(x, y)。原点是左上角。默认为图像的中心。

使用 RandomAffine 的示例

转换图示

转换图示
static get_params(degrees: list[float], translate: Optional[list[float]], scale_ranges: Optional[list[float]], shears: Optional[list[float]], img_size: list[int]) tuple[float, tuple[int, int], float, tuple[float, float]][源代码]

获取仿射变换的参数

返回:

要传递给仿射变换的参数

make_params(flat_inputs: list[Any]) dict[str, Any][源代码]

用于覆盖自定义变换的方法。

请参阅 如何编写自己的 v2 变换

transform(inpt: Any, params: dict[str, Any]) Any[源代码]

用于覆盖自定义变换的方法。

请参阅 如何编写自己的 v2 变换

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源