评价此页

torch.linalg.eig#

torch.linalg.eig(A, *, out=None)#

计算方阵的特征值分解(如果存在)。

K\mathbb{K}R\mathbb{R}C\mathbb{C},方阵 AKn×nA \in \mathbb{K}^{n \times n} 的**特征值分解**(如果存在)定义为

A=Vdiag(Λ)V1VCn×n,ΛCnA = V \operatorname{diag}(\Lambda) V^{-1}\mathrlap{\qquad V \in \mathbb{C}^{n \times n}, \Lambda \in \mathbb{C}^n}

当且仅当 AA可对角化 的时,此分解才存在。当所有特征值都不同时,它就是可对角化的。

支持 float、double、cfloat 和 cdouble 数据类型。也支持矩阵批次,如果 A 是矩阵批次,则输出具有相同的批次维度。

返回的特征值不保证有特定的顺序。

注意

实数矩阵的特征值和特征向量可能为复数。

注意

当输入在 CUDA 设备上时,此函数会使该设备与 CPU 同步。

警告

此函数假定 A可对角化 的(例如,当所有特征值都不同时)。如果它不可对角化,则返回的特征值是正确的,但 AVdiag(Λ)V1A \neq V \operatorname{diag}(\Lambda)V^{-1}.

警告

返回的特征向量被归一化为范数 1。即使如此,矩阵的特征向量也不是唯一的,也不是关于 A 连续的。由于这种非唯一性,不同的硬件和软件可能会计算出不同的特征向量。

这种非唯一性是由以下事实引起的:将特征向量乘以 eiϕ,ϕRe^{i \phi}, \phi \in \mathbb{R} 会产生另一组有效的矩阵特征向量。因此,损失函数不应依赖于特征向量的相位,因为该量不是明确定义的。在计算此函数的梯度时会检查这一点。因此,当输入位于 CUDA 设备上时,此函数的梯度计算将该设备与 CPU 同步。

警告

使用 eigenvectors 张量计算的梯度仅在 A 具有不同特征值时才有限。此外,如果任何两个特征值之间的距离接近于零,梯度将是数值不稳定的,因为它取决于特征值 λi\lambda_i 通过计算 1minijλiλj\frac{1}{\min_{i \neq j} \lambda_i - \lambda_j}.

另请参阅

torch.linalg.eigvals() 仅计算特征值。与 torch.linalg.eig() 不同,eigvals() 的梯度始终具有数值稳定性。

有关用于计算厄米矩阵和对称矩阵的特征值分解的(更快的)函数,请参见 torch.linalg.eigh()

有关用于计算适用于任何形状矩阵的另一种谱分解的函数,请参见 torch.linalg.svd()

有关适用于任何形状矩阵的(更快)分解,请参见 torch.linalg.qr()

参数

A (Tensor) – 形状为 (*, n, n) 的张量,其中 * 是零个或多个批次维度,由可对角化矩阵组成。

关键字参数

out (tuple, optional) – 两个张量的输出元组。如果为 None,则忽略。默认值:None

返回

一个命名元组 (eigenvalues, eigenvectors),对应于上面的 Λ\LambdaVV

eigenvalueseigenvectors 始终是复数值,即使 A 是实数。特征向量由 eigenvectors 的列给出。

示例

>>> A = torch.randn(2, 2, dtype=torch.complex128)
>>> A
tensor([[ 0.9828+0.3889j, -0.4617+0.3010j],
        [ 0.1662-0.7435j, -0.6139+0.0562j]], dtype=torch.complex128)
>>> L, V = torch.linalg.eig(A)
>>> L
tensor([ 1.1226+0.5738j, -0.7537-0.1286j], dtype=torch.complex128)
>>> V
tensor([[ 0.9218+0.0000j,  0.1882-0.2220j],
        [-0.0270-0.3867j,  0.9567+0.0000j]], dtype=torch.complex128)
>>> torch.dist(V @ torch.diag(L) @ torch.linalg.inv(V), A)
tensor(7.7119e-16, dtype=torch.float64)

>>> A = torch.randn(3, 2, 2, dtype=torch.float64)
>>> L, V = torch.linalg.eig(A)
>>> torch.dist(V @ torch.diag_embed(L) @ torch.linalg.inv(V), A)
tensor(3.2841e-16, dtype=torch.float64)