评价此页

torch.matmul#

torch.matmul(input, other, *, out=None) Tensor#

两个张量的矩阵乘积。

行为取决于张量的维度,如下所示:

  • 如果两个张量都是一维的,则返回点积(标量)。

  • 如果两个参数都是二维的,则返回矩阵-矩阵乘积。

  • 如果第一个参数是一维的,第二个参数是二维的,则为矩阵乘法的目的在其维度前面加上一个1。矩阵乘法完成后,删除添加的维度。

  • 如果第一个参数是二维的,第二个参数是一维的,则返回矩阵-向量乘积。

  • 如果两个参数至少是一维的,并且至少一个参数是 N 维的(其中 N > 2),则返回批处理矩阵乘积。如果第一个参数是一维的,则为批处理矩阵乘法的目的在其维度前面加上一个1,之后再删除。如果第二个参数是一维的,则为批处理矩阵乘法的目的在其维度后面加上一个1,之后再删除。非矩阵(即批处理)维度会根据 广播规则 进行广播(因此必须是可广播的)。例如,如果 input 是一个 (j×1×n×n)(j \times 1 \times n \times n) 张量,而 other 是一个 (k×n×n)(k \times n \times n) 张量,则 out 将是一个 (j×k×n×n)(j \times k \times n \times n) 张量。

    请注意,广播逻辑仅根据批次维度确定输入是否可广播,而不考虑矩阵维度。例如,如果 input 是一个 (j×1×n×m)(j \times 1 \times n \times m) 张量,而 other 是一个 (k×m×p)(k \times m \times p) 张量,尽管最后两个维度(即矩阵维度)不同,但这些输入对于广播是有效的。 out 将是一个 (j×k×n×p)(j \times k \times n \times p) 张量。

此操作支持具有 稀疏布局 的参数。特别是,矩阵-矩阵(两个参数都是二维)支持具有与 torch.mm() 相同的限制的稀疏参数。

警告

稀疏支持是测试版功能,某些布局/数据类型/设备组合可能不支持,或可能不支持自动求导。如果您发现缺少功能,请提交功能请求。

此操作符支持TensorFloat32

在某些 ROCm 设备上,当使用 float16 输入时,此模块将对反向传播使用不同精度

注意

此函数的 1 维点积版本不支持 out 参数。

参数
  • input (Tensor) – 要相乘的第一个张量

  • other (Tensor) – 要相乘的第二个张量

关键字参数

out (Tensor, optional) – 输出张量。

示例

>>> # vector x vector
>>> tensor1 = torch.randn(3)
>>> tensor2 = torch.randn(3)
>>> torch.matmul(tensor1, tensor2).size()
torch.Size([])
>>> # matrix x vector
>>> tensor1 = torch.randn(3, 4)
>>> tensor2 = torch.randn(4)
>>> torch.matmul(tensor1, tensor2).size()
torch.Size([3])
>>> # batched matrix x broadcasted vector
>>> tensor1 = torch.randn(10, 3, 4)
>>> tensor2 = torch.randn(4)
>>> torch.matmul(tensor1, tensor2).size()
torch.Size([10, 3])
>>> # batched matrix x batched matrix
>>> tensor1 = torch.randn(10, 3, 4)
>>> tensor2 = torch.randn(10, 4, 5)
>>> torch.matmul(tensor1, tensor2).size()
torch.Size([10, 3, 5])
>>> # batched matrix x broadcasted matrix
>>> tensor1 = torch.randn(10, 3, 4)
>>> tensor2 = torch.randn(4, 5)
>>> torch.matmul(tensor1, tensor2).size()
torch.Size([10, 3, 5])