RandomIoUCrop¶
- class torchvision.transforms.v2.RandomIoUCrop(min_scale: float = 0.3, max_scale: float = 1.0, min_aspect_ratio: float = 0.5, max_aspect_ratio: float = 2.0, sampler_options: Optional[list[float]] = None, trials: int = 40)[源代码]¶
来自 “SSD: Single Shot MultiBox Detector” 的随机 IoU 裁剪变换。
此变换需要输入中包含图像或视频数据和
tv_tensors.BoundingBoxes
。警告
为了正确删除低于 IoU 阈值的边界框,RandomIoUCrop 后面必须紧跟着
SanitizeBoundingBoxes
,无论是立即跟随还是在变换管道的后续步骤中。如果输入是
torch.Tensor
或TVTensor
(例如Image
、Video
、BoundingBoxes
等),它可以拥有任意数量的前导批次维度。例如,图像可以具有[..., C, H, W]
形状。边界框可以具有[..., 4]
形状。- 参数:
min_scale (float, 可选) – 输入尺寸的最小缩放因子。
max_scale (float, 可选) – 输入尺寸的最大缩放因子。
min_aspect_ratio (float, 可选) – 裁剪后的图像或视频的最小宽高比。
max_aspect_ratio (float, 可选) – 裁剪后的图像或视频的最大宽高比。
sampler_options (list of python:float, 可选) – 所有框与裁剪后的图像或视频之间的最小 IoU (Jaccard) 重叠列表。默认值
None
,对应于[0.0, 0.1, 0.3, 0.5, 0.7, 0.9, 1.0]
trials (int, 可选) – 为给定的最小 IoU (Jaccard) 重叠值找到裁剪次数。默认值 40。
使用
RandomIoUCrop
的示例