torch.nn.functional — PyTorch 2.9 文档

卷积函数#

`conv1d`	对由多个输入平面组成的输入信号进行1D卷积操作。
`conv2d`	对由多个输入平面组成的输入图像应用二维卷积。
`conv3d`	对由多个输入平面组成的输入图像应用三维卷积。
`conv_transpose1d`	对由多个输入平面组成的输入信号应用一维转置卷积算子，有时也称为“反卷积”。
`conv_transpose2d`	对由多个输入平面组成的输入图像应用二维转置卷积算子，有时也称为“反卷积”。
`conv_transpose3d`	对由多个输入平面组成的输入图像应用三维转置卷积算子，有时也称为“反卷积”。
`unfold`	从批量输入张量中提取滑动局部块。
`fold`	将一系列滑动局部块组合成一个大的包含张量。

池化函数#

`avg_pool1d`	对由多个输入平面组成的输入信号进行1D平均池化操作。
`avg_pool2d`	在 $kH \times kW$ 区域中以 $sH \times sW$ 为步长进行二维平均池化操作。
`avg_pool3d`	在 $kT \times kH \times kW$ 区域中以 $sT \times sH \times sW$ 为步长进行三维平均池化操作。
`max_pool1d`	对由多个输入平面组成的输入信号应用 1D 最大池化。
`max_pool2d`	在由多个输入平面组成的输入信号上应用 2D 最大池化。
`max_pool3d`	对由多个输入平面组成的输入信号应用 3D 最大池化。
`max_unpool1d`	计算 `MaxPool1d` 的部分逆运算。
`max_unpool2d`	计算 `MaxPool2d` 的部分逆运算。
`max_unpool3d`	计算 `MaxPool3d` 的部分逆运算。
`lp_pool1d`	对由多个输入平面组成的输入信号应用一维功率平均池化。
`lp_pool2d`	对由多个输入平面组成的输入信号应用二维功率平均池化。
`lp_pool3d`	对由多个输入平面组成的输入信号应用三维功率平均池化。
`adaptive_max_pool1d`	对由多个输入平面组成的输入信号应用 1D 自适应最大池化。
`adaptive_max_pool2d`	对由多个输入平面组成的输入信号应用 2D 自适应最大池化。
`adaptive_max_pool3d`	对由多个输入平面组成的输入信号应用 3D 自适应最大池化。
`adaptive_avg_pool1d`	对由多个输入平面组成的输入信号应用 1D 自适应平均池化。
`adaptive_avg_pool2d`	对由多个输入平面组成的输入信号应用二维自适应平均池化。
`adaptive_avg_pool3d`	对由多个输入平面组成的输入信号应用三维自适应平均池化。
`fractional_max_pool2d`	对由多个输入平面组成的输入信号应用二维分数最大池化。
`fractional_max_pool3d`	对由多个输入平面组成的输入信号应用三维分数最大池化。

注意力机制#

torch.nn.attention.bias 模块包含旨在与 scaled_dot_product_attention 一起使用的 attention_biases。

scaled_dot_product_attention

scaled_dot_product_attention(query, key, value, attn_mask=None, dropout_p=0.0,

非线性激活函数#

`threshold`	对输入张量的每个元素应用阈值。
`threshold_`	`threshold()` 的原地版本。
`relu`	逐元素应用线性整流单元函数。
`relu_`	`relu()` 的原地版本。
`hardtanh`	逐元素应用 HardTanh 函数。
`hardtanh_`	`hardtanh()` 的原地版本。
`hardswish`	逐元素应用 hardswish 函数。
`relu6`	逐元素应用 $\text{ReLU6}(x) = \min(\max(0,x), 6)$ 函数。
`elu`	逐元素应用指数线性单元 (ELU) 函数。
`elu_`	`elu()` 的原地版本。
`selu`	逐元素应用 $\text{SELU}(x) = scale * (\max(0,x) + \min(0, \alpha * (\exp(x) - 1)))$ 函数，其中 $\alpha=1.6732632423543772848170429916717$ 和 $scale=1.0507009873554804934193349852946$ 。
`celu`	逐元素应用 $\text{CELU}(x) = \max(0,x) + \min(0, \alpha * (\exp(x/\alpha) - 1))$ 函数。
`leaky_relu`	逐元素应用 $\text{LeakyReLU}(x) = \max(0, x) + \text{negative\_slope} * \min(0, x)$ 函数。
`leaky_relu_`	`leaky_relu()` 的原地版本。
`prelu`	逐元素应用 $\text{PReLU}(x) = \max(0,x) + \text{weight} * \min(0,x)$ 函数，其中 weight 是一个可学习的参数。
`rrelu`	随机 LeakyReLU。
`rrelu_`	`rrelu()` 的原地版本。
`glu`	门控线性单元。
`gelu`	当 approximate 参数为 'none' 时，它会逐元素应用 $\text{GELU}(x) = x * \Phi(x)$ 函数。
`logsigmoid`	逐元素应用 $\text{LogSigmoid}(x_i) = \log \left(\frac{1}{1 + \exp(-x_i)}\right)$ 函数。
`hardshrink`	逐元素应用 hard shrinkage 函数。
`tanhshrink`	逐元素应用 $\text{Tanhshrink}(x) = x - \text{Tanh}(x)$ 函数。
`softsign`	逐元素应用 $\text{SoftSign}(x) = \frac{x}{1 + \|x\|}$ 函数。
`softplus`	逐元素应用 $\text{Softplus}(x) = \frac{1}{\beta} * \log(1 + \exp(\beta * x))$ 函数。
`softmin`	应用 softmin 函数。
`softmax`	应用 softmax 函数。
`softshrink`	逐元素应用 soft shrinkage 函数。
`gumbel_softmax`	从 Gumbel-Softmax 分布采样（链接 1 链接 2），并可选地进行离散化。
`log_softmax`	应用 softmax 然后取对数。
`tanh`	逐元素应用 $\text{Tanh}(x) = \tanh(x) = \frac{\exp(x) - \exp(-x)}{\exp(x) + \exp(-x)}$ 函数。
`sigmoid`	逐元素应用 $\text{Sigmoid}(x) = \frac{1}{1 + \exp(-x)}$ 函数。
`hardsigmoid`	逐元素应用 Hardsigmoid 函数。
`silu`	逐元素应用 Sigmoid Linear Unit (SiLU) 函数。
`mish`	逐元素应用 Mish 函数。
`batch_norm`	跨批次数据为每个通道应用 Batch Normalization。
`group_norm`	为最后若干维应用 Group Normalization。
`instance_norm`	在批次中的每个数据样本内独立为每个通道应用 Instance Normalization。
`layer_norm`	为最后若干维应用 Layer Normalization。
`local_response_norm`	对输入信号应用局部响应归一化。
`rms_norm`	应用均方根层归一化。
`normalize`	在指定维度上执行输入的 $L_p$ 归一化。

线性函数#

linear

对输入数据应用线性变换： $y = xA^T + b$ 。

bilinear

对输入数据应用双线性变换： $y = x_1^T A x_2 + b$ 。

Dropout 函数#

`dropout`	在训练期间，以 `p` 的概率随机将输入张量的某些元素归零。
`alpha_dropout`	对输入应用 alpha dropout。
`feature_alpha_dropout`	随机屏蔽整个通道（通道是特征图）。
`dropout1d`	随机将整个通道（通道是一维特征图）归零。
`dropout2d`	随机将整个通道（通道是二维特征图）归零。
`dropout3d`	随机将整个通道（通道是三维特征图）归零。

稀疏函数#

embedding

生成一个简单的查找表，用于在一个固定的字典和大小中查找嵌入。

embedding_bag

计算嵌入的“袋”的总和、平均值或最大值。

one_hot

接收索引值为 (*) 形状的 LongTensor，并返回一个形状为 (*, num_classes) 的张量，该张量中除了最后一个维度索引与输入张量的相应值匹配的位置外，其余位置均为零，匹配的位置值为 1。

距离函数#

pairwise_distance

有关详细信息，请参见 torch.nn.PairwiseDistance。

cosine_similarity

沿 dim 返回 x1 和 x2 之间的余弦相似度。

pdist

计算输入中每对行向量之间的 p-范数距离。

损失函数#

`binary_cross_entropy`	计算目标和输入概率之间的二元交叉熵。
`binary_cross_entropy_with_logits`	计算目标和输入 logits 之间的二元交叉熵。
`poisson_nll_loss`	计算泊松负对数似然损失。
`cosine_embedding_loss`	计算余弦嵌入损失。
`cross_entropy`	计算输入 logits 和目标之间的交叉熵损失。
`ctc_loss`	计算连接主义时间分类（CTC）损失。
`gaussian_nll_loss`	计算高斯负对数似然损失。
`hinge_embedding_loss`	计算 hinge 嵌入损失。
`kl_div`	计算 KL 散度损失。
`l1_loss`	计算 L1 损失，可选加权。
`mse_loss`	计算逐元素均方误差，可选加权。
`margin_ranking_loss`	计算间隔排名损失。
`multilabel_margin_loss`	计算多标签间隔损失。
`multilabel_soft_margin_loss`	计算多标签软间隔损失。
`multi_margin_loss`	计算多类别间隔损失，可选加权。
`nll_loss`	计算负对数似然损失。
`huber_loss`	计算 Huber 损失，可选加权。
`smooth_l1_loss`	计算 Smooth L1 损失。
`soft_margin_loss`	计算软间隔损失。
`triplet_margin_loss`	计算给定输入张量与大于 0 的间隔之间的三元组损失。
`triplet_margin_with_distance_loss`	使用自定义距离函数计算输入张量之间的三元组间隔损失。

视觉函数#

`pixel_shuffle`	将形状为 $(, C \times r^2, H, W)$ 的张量重新排列成形状为 $(, C, H \times r, W \times r)$ 的张量，其中 r 是 `upscale_factor`。
`pixel_unshuffle`	逆转 `PixelShuffle` 操作，将形状为 $(, C, H \times r, W \times r)$ 的张量重新排列成形状为 $(, C \times r^2, H, W)$ 的张量，其中 r 是 `downscale_factor`。
`pad`	填充张量。
`interpolate`	下采样/上采样输入。
`upsample`	上采样输入。
`upsample_nearest`	使用最近邻像素值上采样输入。
`upsample_bilinear`	使用双线性上采样对输入进行上采样。
`grid_sample`	计算 grid sample。
`affine_grid`	给定仿射矩阵 `theta` 的批次，生成二维或三维流场（采样网格）。

DataParallel 函数（多 GPU，分布式）#

data_parallel#

torch.nn.parallel.data_parallel

在 device_ids 中指定的 GPU 上并行评估模块（输入）。

torch.nn.functional#