RandomIoUCrop¶

class torchvision.transforms.v2.RandomIoUCrop(min_scale: float = 0.3, max_scale: float = 1.0, min_aspect_ratio: float = 0.5, max_aspect_ratio: float = 2.0, sampler_options: Optional[list[float]] = None, trials: int = 40)[源代码]¶

来自 “SSD: Single Shot MultiBox Detector” 的随机 IoU 裁剪变换。

此变换需要输入中包含图像或视频数据和 tv_tensors.BoundingBoxes。

警告

为了正确删除低于 IoU 阈值的边界框，RandomIoUCrop 后面必须紧跟着 SanitizeBoundingBoxes，无论是立即跟随还是在变换管道的后续步骤中。

如果输入是 torch.Tensor 或 TVTensor（例如 Image、Video、BoundingBoxes 等），它可以拥有任意数量的前导批次维度。例如，图像可以具有 [..., C, H, W] 形状。边界框可以具有 [..., 4] 形状。

参数:

min_scale (float, 可选) – 输入尺寸的最小缩放因子。
max_scale (float, 可选) – 输入尺寸的最大缩放因子。
min_aspect_ratio (float, 可选) – 裁剪后的图像或视频的最小宽高比。
max_aspect_ratio (float, 可选) – 裁剪后的图像或视频的最大宽高比。
sampler_options (list of python:float, 可选) – 所有框与裁剪后的图像或视频之间的最小 IoU (Jaccard) 重叠列表。默认值 None，对应于 [0.0, 0.1, 0.3, 0.5, 0.7, 0.9, 1.0]
trials (int, 可选) – 为给定的最小 IoU (Jaccard) 重叠值找到裁剪次数。默认值 40。