算子¶
torchvision.ops
实现专门用于计算机视觉的算子、损失函数和层。
注意
所有算子都原生支持 TorchScript。
检测和分割算子¶
以下算子执行目标检测和分割模型所需的预处理和后处理。
|
以批处理方式执行非最大抑制。 |
|
计算给定掩码的边界框。 |
|
根据交并比 (IoU) 对框执行非最大抑制 (NMS)。 |
|
执行感兴趣区域 (RoI) 对齐算子,使用平均池化,如 Mask R-CNN 中所述。 |
|
执行 Fast R-CNN 中所述的感兴趣区域 (RoI) 池化算子。 |
|
执行 Light-Head R-CNN 中提到的位置敏感感兴趣区域 (RoI) 对齐算子。 |
|
执行 R-FCN 中所述的位置敏感感兴趣区域 (RoI) 池化算子。 |
|
在一组特征图之上添加 FPN 的模块。 |
|
多尺度 RoIAlign 池化,这对于带或不带 FPN 的检测很有用。 |
|
参见 |
|
参见 |
|
参见 |
|
参见 |
边界框算子¶
这些实用函数对边界框执行各种操作。
|
计算给定格式的边界框集合的面积。 |
|
将给定 |
|
返回给定格式的两个边界框集合之间的交并比 (Jaccard 指数)。 |
|
剪切边界框,使其位于大小为 |
|
返回两个边界框集合之间的完整交并比 (Jaccard 指数)。 |
|
返回两个边界框集合之间的距离交并比 (Jaccard 指数)。 |
|
返回两个边界框集合之间的广义交并比 (Jaccard 指数)。 |
|
从 |
损失函数¶
实现了以下计算机视觉特定损失函数。
|
梯度友好的 IoU 损失,在边界框不重叠时具有非零的附加惩罚。 |
|
梯度友好的 IoU 损失,在边界框中心距离不为零时具有非零的附加惩罚。 |
|
梯度友好的 IoU 损失,在边界框不重叠时具有非零的附加惩罚,并且该惩罚随其最小包围框的大小而缩放。 |
|
RetinaNet 中用于密集检测的损失函数:https://arxiv.org/abs/1708.02002。 |
层¶
TorchVision 提供常用的构建块作为层。
|
用于 Convolution2d-Normalization-Activation 块的可配置模块。 |
|
用于 Convolution3d-Normalization-Activation 块的可配置模块。 |
|
参见 |
|
参见 |
|
参见 |
|
BatchNorm2d,其中批量统计量和仿射参数是固定的。 |
|
此模块实现多层感知机 (MLP) 模块。 |
|
此模块返回一个具有置换维度的张量输入的视图。 |
|
此模块实现来自 https://arxiv.org/abs/1709.01507 的 Squeeze-and-Excitation 块(参见图。 |
|
|
执行可变形卷积 v2,如 Deformable ConvNets v2: More Deformable, Better Results 中所述(如果 |
|
实现来自 "DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890> 的 DropBlock2d。 |
|
实现来自 "DropBlock: A regularization method for convolutional networks" <https://arxiv.org/abs/1810.12890> 的 DropBlock3d。 |
|
实现来自 "Deep Networks with Stochastic Depth" 的随机深度,用于随机丢弃残差架构的残差分支。 |