Video ResNet¶
VideoResNet 模型基于 《A Closer Look at Spatiotemporal Convolutions for Action Recognition》 论文。
警告
The video module is in Beta stage, and backward compatibility is not guaranteed.
模型构建器¶
以下模型构建器可用于实例化 VideoResNet 模型,可以选择是否加载预训练权重。所有模型构建器在内部都依赖于 torchvision.models.video.resnet.VideoResNet
基类。有关此类的更多详细信息,请参阅 源代码。
|
构建 18 层 Resnet3D 模型。 |
|
构建 18 层混合卷积网络,如 |
|
构建 18 层深度 R(2+1)D 网络,如 |