运算符¶
torchvision.ops
实现了一些特定的计算机视觉运算符、损失函数和层。
注意
所有运算符都支持本地 TorchScript。
检测和分割运算符¶
以下运算符执行目标检测和分割模型所需的预处理和后处理。
|
以批处理方式执行非极大值抑制。 |
|
计算提供的掩码周围的边界框。 |
|
根据交并比 (IoU),对边界框执行非极大值抑制 (NMS)。 |
|
执行感兴趣区域 (RoI) 对齐运算符,使用平均池化,如 Mask R-CNN 中所述。 |
|
执行感兴趣区域 (RoI) 池化运算符,如 Fast R-CNN 中所述 |
|
执行位置敏感感兴趣区域 (RoI) 对齐运算符,如 Light-Head R-CNN 中所述。 |
|
执行位置敏感感兴趣区域 (RoI) 池化运算符,如 R-FCN 中所述 |
|
在特征图集之上添加 FPN 的模块。 |
|
多尺度 RoIAlign 池化,在有或没有 FPN 的情况下对检测很有用。 |
|
请参见 |
|
请参见 |
|
请参见 |
|
请参见 |
边界框运算符¶
这些实用函数对边界框执行各种操作。
|
计算一组边界框的面积,这些边界框由其 (x1, y1, x2, y2) 坐标指定。 |
|
将 |
|
返回两组边界框之间的交并比 (Jaccard 指数)。 |
|
裁剪边界框,使其位于大小为 |
|
返回两组边界框之间的完整交并比 (Jaccard 指数)。 |
|
返回两组边界框之间的距离交并比 (Jaccard 指数)。 |
|
返回两组边界框之间的广义交并比 (Jaccard 指数)。 |
|
移除 |
损失函数¶
实现了以下特定于视觉的损失函数
|
梯度友好的 IoU 损失,当边界框不重叠时具有非零的附加惩罚。 |
|
梯度友好的 IoU 损失,当边界框中心之间的距离不为零时具有非零的附加惩罚。 |
|
梯度友好的 IoU 损失,当边界框不重叠时具有非零的附加惩罚,并且该惩罚随着它们最小包围框的大小而变化。 |
|
用于 RetinaNet 进行密集检测的损失:https://arxiv.org/abs/1708.02002。 |
层¶
TorchVision 提供常用构建块作为层
|
用于 Convolution2d-Normalization-Activation 块的可配置模块。 |
|
用于 Convolution3d-Normalization-Activation 块的可配置模块。 |
|
请参见 |
|
请参见 |
|
请参见 |
|
BatchNorm2d,其中批量统计量和仿射参数是固定的 |
|
此模块实现了多层感知机 (MLP) 模块。 |
|
此模块返回输入张量的视图,其维度已排列。 |
|
此模块实现了 Squeeze-and-Excitation 块,源自 https://arxiv.org/abs/1709.01507 (参见图。 |
|
请参见 |
|
执行可变形卷积 v2,如果 |
|
实现了 DropBlock2d,源自 "DropBlock:卷积网络的正则化方法" <https://arxiv.org/abs/1810.12890>。 |
|
实现了 DropBlock3d,源自 "DropBlock:卷积网络的正则化方法" <https://arxiv.org/abs/1810.12890>。 |
|
实现了随机深度,源自 "具有随机深度的深度网络",用于随机丢弃残差架构的残差分支。 |