DreamerValueLoss¶
- class torchrl.objectives.DreamerValueLoss(*args, **kwargs)[源代码]¶
Dreamer Value Loss。
计算 dreamer value 模型的损失。value 损失在预测值和 lambda 目标之间计算。
参考: https://arxiv.org/abs/1912.01603。
- 参数:
value_model (TensorDictModule) – value 模型。
value_loss (str, optional) – 用于 value 损失的损失函数。默认为
"l2"
。discount_loss (bool, optional) – 如果为
True
,则使用 gamma 折扣因子对损失进行折扣。默认为 False。gamma (
float
, optional) – gamma 折扣因子。默认为0.99
。
- default_keys¶
别名:
_AcceptedKeys