GaussianNLLLoss#
- class torch.nn.GaussianNLLLoss(*, full=False, eps=1e-06, reduction='mean')[source]#
高斯负对数似然损失。
目标被视为来自高斯分布的样本,其期望和方差由神经网络预测。对于一个
target
张量,建模为具有期望为input
张量和正方差var
张量的高斯分布,损失为其中
eps
用于保持稳定性。默认情况下,损失函数中的常数项会被省略,除非full
为True
。如果var
的尺寸与input
不同(由于同方差假设),为了正确广播,它必须具有一个尺寸为1的最后一个维度,或者比input
少一个维度(所有其他尺寸均相同)。- 参数
- 形状
输入: 或 ,其中 表示任意数量的附加维度
目标: 或 ,与输入形状相同,或与输入形状相同但有一个维度等于1(允许广播)
方差: 或 ,与输入形状相同,或与输入形状相同但有一个维度等于1,或与输入形状相同但少一个维度(允许广播),或为标量值
输出:如果
reduction
为'mean'
(默认)或'sum'
,则为标量。如果reduction
为'none'
,则为,与输入形状相同
示例
>>> loss = nn.GaussianNLLLoss() >>> input = torch.randn(5, 2, requires_grad=True) >>> target = torch.randn(5, 2) >>> var = torch.ones(5, 2, requires_grad=True) # heteroscedastic >>> output = loss(input, target, var) >>> output.backward()
>>> loss = nn.GaussianNLLLoss() >>> input = torch.randn(5, 2, requires_grad=True) >>> target = torch.randn(5, 2) >>> var = torch.ones(5, 1, requires_grad=True) # homoscedastic >>> output = loss(input, target, var) >>> output.backward()
注意
对
var
的裁剪会被自动梯度忽略,因此梯度不受其影响。- 参考
Nix, D. A. and Weigend, A. S., “Estimating the mean and variance of the target probability distribution”, Proceedings of 1994 IEEE International Conference on Neural Networks (ICNN’94), Orlando, FL, USA, 1994, pp. 55-60 vol.1, doi: 10.1109/ICNN.1994.374138。