评价此页

torch.baddbmm#

torch.baddbmm(input, batch1, batch2, out_dtype=None, *, beta=1, alpha=1, out=None) Tensor#

执行 batch1batch2 中的矩阵的批次矩阵-矩阵乘法。 input 会被加到最终结果中。

batch1batch2 必须是 3-D 张量,每个张量包含相同数量的矩阵。

如果 batch1 是一个 (b×n×m)(b \times n \times m) 张量,batch2 是一个 (b×m×p)(b \times m \times p) 张量,那么 input 必须与 (b×n×p)(b \times n \times p) 张量 可广播,并且 out 将是一个 (b×n×p)(b \times n \times p) 张量。 alphabeta 的含义与 torch.addbmm() 中使用的缩放因子相同。

outi=β inputi+α (batch1i@batch2i)\text{out}_i = \beta\ \text{input}_i + \alpha\ (\text{batch1}_i \mathbin{@} \text{batch2}_i)

如果 beta 为 0,则 input 的内容将被忽略,其中的 naninf 也不会传播。

对于 FloatTensorDoubleTensor 类型的输入,参数 betaalpha 必须是实数,否则它们应该是整数。

此操作符支持TensorFloat32

在某些 ROCm 设备上,当使用 float16 输入时,此模块将对反向传播使用不同精度

参数
  • input (Tensor) – 要添加的张量

  • batch1 (Tensor) – 要相乘的第一个矩阵批次

  • batch2 (Tensor) – 要相乘的第二个矩阵批次

  • out_dtype (dtype, optional) – 输出张量的 dtype,仅支持 CUDA 以及 torch.float32 输入 torch.float16/torch.bfloat16 的情况

关键字参数
  • beta (Number, optional) – input 的乘数(β\beta

  • alpha (Number, optional) – batch1@batch2\text{batch1} \mathbin{@} \text{batch2} 的乘数(α\alpha

  • out (Tensor, optional) – 输出张量。

示例

>>> M = torch.randn(10, 3, 5)
>>> batch1 = torch.randn(10, 3, 4)
>>> batch2 = torch.randn(10, 4, 5)
>>> torch.baddbmm(M, batch1, batch2).size()
torch.Size([10, 3, 5])