ConvTranspose1d#
- class torch.nn.ConvTranspose1d(in_channels, out_channels, kernel_size, stride=1, padding=0, output_padding=0, groups=1, bias=True, dilation=1, padding_mode='zeros', device=None, dtype=None)[源代码]#
对由多个输入平面组成的输入图像应用 1D 转置卷积运算符。
此模块可以看作是 Conv1d 关于其输入的梯度。它也被称为分数步长卷积或反卷积(尽管它不是实际的反卷积运算,因为它不计算卷积的真实逆)。有关更多信息,请参见可视化和反卷积网络论文。
此模块支持 TensorFloat32。
在某些 ROCm 设备上,当使用 float16 输入时,此模块将对反向传播使用不同精度。
stride控制互相关的步长。padding控制两侧的隐式零填充量,其值为dilation * (kernel_size - 1) - padding个点。有关详细信息,请参阅下面的说明。output_padding控制添加到输出形状一侧的额外尺寸。有关详细信息,请参见下面的注释。dilation控制核点之间的间距;也称为 à trous 算法。这比较难描述,但 此处 的链接对dilation的作用有很好的可视化。groups控制输入和输出之间的连接。in_channels和out_channels都必须能被groups整除。例如,当 groups=1 时,所有输入都会与所有输出进行卷积。
当 groups=2 时,操作相当于有两个并排的卷积层,每个层看到一半的输入通道并产生一半的输出通道,然后将两者连接起来。
当 groups =
in_channels时,每个输入通道都与自己的滤波器组(大小为 )进行卷积。
注意
padding参数会在输入的两侧有效地增加dilation * (kernel_size - 1) - padding的零填充。这样设置是为了使得当一个Conv1d和一个ConvTranspose1d使用相同的参数初始化时,它们在输入和输出形状方面互为逆运算。但是,当stride > 1时,Conv1d会将多个输入形状映射到同一个输出形状。output_padding参数是为了解决这种歧义,通过有效地增加一侧的计算输出形状来实现。请注意,output_padding仅用于确定输出形状,实际上并不会向输出添加零填充。注意
在某些情况下,当使用带有 CuDNN 的 CUDA 后端时,此运算符可能会选择非确定性算法以提高性能。如果您不希望这样做,可以尝试通过设置
torch.backends.cudnn.deterministic = True来使操作确定化(可能会牺牲性能)。有关背景信息,请参阅关于 可复现性 的说明。- 参数
- 形状
输入: 或
输出: 或 ,其中