torch.nn.functional.conv3d#

torch.nn.functional.conv3d(input, weight, bias=None, stride=1, padding=0, dilation=1, groups=1) → Tensor#

对由多个输入平面组成的输入图像应用 3D 卷积。

此操作符支持TensorFloat32。

有关详细信息和输出形状，请参阅 Conv3d。

注意

在某些情况下，当在 CUDA 设备上使用张量并利用 CuDNN 时，此算子可能会选择一个非确定性算法来提高性能。如果这不可取，你可以尝试将操作设置为确定性的（可能以性能为代价），方法是设置 torch.backends.cudnn.deterministic = True。有关更多信息，请参阅可复现性。

注意

此运算符支持复数数据类型，例如 complex32, complex64, complex128。

参数

input – 输入张量，形状为 $(\text{minibatch} , \text{in\_channels} , iT , iH , iW)$
weight – 滤波器，形状为 $(\text{out\_channels} , \frac{\text{in\_channels}}{\text{groups}} , kT , kH , kW)$
bias – 可选的偏置张量，形状为 $(\text{out\_channels})$ 。默认为 None
stride – 卷积核的步长。可以是一个单独的数字，也可以是一个元组 (sT, sH, sW)。默认为 1
padding –
在输入两侧的隐式填充。可以是一个字符串 {‘valid’, ‘same’}、一个单独的数字或一个元组 (padT, padH, padW)。默认为 0 padding='valid' 等同于无填充。padding='same' 会填充输入，使得输出的形状与输入相同。但是，此模式不支持任何非 1 的步长值。

警告

对于 padding='same'，如果 weight 的长度是偶数且 dilation 在任何维度上都是奇数，则可能需要在内部进行一次完整的 pad() 操作。这会降低性能。
dilation – 内核元素之间的间距。可以是一个单独的数字，也可以是一个元组 (dT, dH, dW)。默认为 1
groups – 将输入分割成组， $\text{in\_channels}$ 必须能被组数整除。默认值：1

示例

>>> filters = torch.randn(33, 16, 3, 3, 3)
>>> inputs = torch.randn(20, 16, 50, 10, 20)
>>> F.conv3d(inputs, filters)

torch.nn.functional.conv3d#

文档

教程

资源