评价此页

torch.nn.functional.conv3d#

torch.nn.functional.conv3d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) Tensor#

将卷积核应用于由多个输入层组成的输入图像的 3D 卷积。

此操作符支持TensorFloat32

有关详细信息和输出形状,请参阅 Conv3d

注意

在某些情况下,当输入张量位于 CUDA 设备上并使用 CuDNN 时,此算子可能会选择非确定性算法以提高性能。如果这是不希望的,您可以尝试通过设置 torch.backends.cudnn.deterministic = True 来使操作确定性(可能会降低性能)。有关更多信息,请参阅 可复现性

注意

此运算符支持复数数据类型,例如 complex32, complex64, complex128

参数
  • input – 输入张量,形状为 (minibatch,in_channels,iT,iH,iW)(\text{minibatch} , \text{in\_channels} , iT , iH , iW)

  • weight – 滤波器,形状为 (out_channels,in_channelsgroups,kT,kH,kW)(\text{out\_channels} , \frac{\text{in\_channels}}{\text{groups}} , kT , kH , kW)

  • bias – 可选偏置张量,形状为 (out_channels)(\text{out\_channels})。默认为 None

  • stride – 卷积核的步幅。可以是单个数字或元组 (sT, sH, sW)。默认为 1

  • padding

    输入两侧的隐式填充。可以是字符串 {‘valid’, ‘same’},单个数字或元组 (padT, padH, padW)。默认为 0 padding='valid' 等同于无填充。 padding='same' 会填充输入,使输出具有与输入相同的形状。但是,此模式不支持任何步幅值,除了 1。

    警告

    对于 padding='same',如果 weight 是偶数长度且 dilation 在任何维度上都是奇数,则内部可能需要进行完整的 pad() 操作。这会降低性能。

  • dilation – 卷积核元素之间的间距。可以是单个数字或元组 (dT, dH, dW)。默认为 1

  • groups – 将输入分成组,in_channels\text{in\_channels} 应能被组数整除。默认为 1

示例

>>> filters = torch.randn(33, 16, 3, 3, 3)
>>> inputs = torch.randn(20, 16, 50, 10, 20)
>>> F.conv3d(inputs, filters)