评价此页

torch.linalg.pinv#

torch.linalg.pinv(A, *, atol=None, rtol=None, hermitian=False, out=None) Tensor#

计算矩阵的伪逆(摩尔-彭罗斯逆)。

伪逆可以通过代数定义,但通过SVD来理解在计算上更方便。

支持浮点、双精度、复数浮点和复数双精度的数据类型。也支持矩阵批次,如果 A 是一个矩阵批次,则输出具有相同的批次维度。

如果 hermitian= True,假定 A 是厄米矩阵(如果为复数)或对称矩阵(如果为实数),但内部不进行检查。而是仅使用矩阵的下三角部分进行计算。

小于 max(atol,σ1rtol)\max(\text{atol}, \sigma_1 \cdot \text{rtol}) 的奇异值(或 hermitian= True 时特征值的范数)将被视为零并被忽略,其中 σ1\sigma_1 是最大的奇异值(或特征值)。

如果未指定 rtolA 的维度为 (m, n),则相对容差设置为 rtol=max(m,n)ε\text{rtol} = \max(m, n) \varepsilon,其中 ε\varepsilonA 的 dtype 的 epsilon 值(参见 finfo)。如果未指定 rtolatol 被指定为大于零,则 rtol 将被设置为零。

如果 atolrtol 是一个 torch.Tensor,则其形状必须能够广播到 A 的奇异值,A 的奇异值由 torch.linalg.svd() 返回。

注意

如果 hermitian= False,此函数使用 torch.linalg.svd();如果 hermitian= True,则使用 torch.linalg.eigh()。对于 CUDA 输入,此函数会同步该设备与 CPU。

注意

如果可能,请考虑使用 torch.linalg.lstsq() 将矩阵左乘伪逆,因为

torch.linalg.lstsq(A, B).solution == A.pinv() @ B

当可能时,始终首选使用 lstsq(),因为它比显式计算伪逆更快且数值更稳定。

注意

此函数具有与 NumPy 兼容的变体 linalg.pinv(A, rcond, hermitian=False)。但是,使用位置参数 rcond 已弃用,推荐使用 rtol

警告

此函数内部使用 torch.linalg.svd()(或在 hermitian= True 时使用 torch.linalg.eigh()),因此其导数与这些函数的导数存在相同的问题。有关更多详细信息,请参阅 torch.linalg.svd()torch.linalg.eigh() 中的警告。

另请参阅

torch.linalg.inv() 计算方阵的逆。

torch.linalg.lstsq() 使用数值稳定的算法计算 A.pinv() @ B

参数
  • A (Tensor) – 形状为 (*, m, n) 的张量,其中 * 是零个或多个批处理维度。

  • rcond (float, Tensor, optional) – [NumPy 兼容]。rtol 的别名。默认为 None

关键字参数
  • atol (float, Tensor, optional) – 绝对容差值。当为 None 时,被视为零。默认为 None

  • rtol (float, Tensor, optional) – 相对容差值。有关 None 时所取的值,请参见上文。默认为 None

  • hermitian (bool, optional) – 指示 A 是否是厄米(如果是复数)或对称(如果是实数)。默认为 False

  • out (Tensor, optional) – 输出张量。如果为 None 则忽略。默认为 None

示例

>>> A = torch.randn(3, 5)
>>> A
tensor([[ 0.5495,  0.0979, -1.4092, -0.1128,  0.4132],
        [-1.1143, -0.3662,  0.3042,  1.6374, -0.9294],
        [-0.3269, -0.5745, -0.0382, -0.5922, -0.6759]])
>>> torch.linalg.pinv(A)
tensor([[ 0.0600, -0.1933, -0.2090],
        [-0.0903, -0.0817, -0.4752],
        [-0.7124, -0.1631, -0.2272],
        [ 0.1356,  0.3933, -0.5023],
        [-0.0308, -0.1725, -0.5216]])

>>> A = torch.randn(2, 6, 3)
>>> Apinv = torch.linalg.pinv(A)
>>> torch.dist(Apinv @ A, torch.eye(3))
tensor(8.5633e-07)

>>> A = torch.randn(3, 3, dtype=torch.complex64)
>>> A = A + A.T.conj()  # creates a Hermitian matrix
>>> Apinv = torch.linalg.pinv(A, hermitian=True)
>>> torch.dist(Apinv @ A, torch.eye(3))
tensor(1.0830e-06)