torch.baddbmm#

torch.baddbmm(input, batch1, batch2, out_dtype=None, *, beta=1, alpha=1, out=None) → Tensor#

执行 batch1 和 batch2 中矩阵的批次矩阵乘法。 input 被加到最终结果中。

batch1 和 batch2 必须是 3 维张量，每个张量包含相同数量的矩阵。

如果 batch1 是一个 $(b \times n \times m)$ 张量， batch2 是一个 $(b \times m \times p)$ 张量，那么 input 必须与一个 $(b \times n \times p)$ 张量可广播，并且 out 将是一个 $(b \times n \times p)$ 张量。 alpha 和 beta 的含义与 torch.addbmm() 中使用的缩放因子相同。

\text{out}_i = \beta\ \text{input}_i + \alpha\ (\text{batch1}_i \mathbin{@} \text{batch2}_i)

如果 beta 为 0，则 input 的内容将被忽略，并且其中的 nan 和 inf 不会被传播。

对于 FloatTensor 或 DoubleTensor 类型的输入，参数 beta 和 alpha 必须是实数，否则它们应该是整数。

此操作符支持TensorFloat32。

在某些 ROCm 设备上，当使用 float16 输入时，此模块将对反向传播使用不同精度。

参数

input (Tensor) – 要添加的张量
batch1 (Tensor) – 要相乘的第一个矩阵批次
batch2 (Tensor) – 要相乘的第二个矩阵批次
out_dtype (dtype, optional) – 输出张量的数据类型。仅在 CUDA 上支持，并且当输入数据类型为 torch.float16/torch.bfloat16 时，支持 torch.float32。

关键字参数

beta (Number, optional) – input 的乘数（ $\beta$ ）
alpha (Number, optional) – $\text{batch1} \mathbin{@} \text{batch2}$ 的乘数（ $\alpha$ ）
out (Tensor, optional) – 输出张量。

示例

>>> M = torch.randn(10, 3, 5)
>>> batch1 = torch.randn(10, 3, 4)
>>> batch2 = torch.randn(10, 4, 5)
>>> torch.baddbmm(M, batch1, batch2).size()
torch.Size([10, 3, 5])

torch.baddbmm#

文档

教程

资源