快捷方式

ValueEstimators

class torchrl.objectives.ValueEstimators(value)[source]

用于自定义构建估计器的值函数枚举器。

当损失模块允许时,可以灵活使用各种值函数。

示例

>>> dqn_loss = DQNLoss(actor)
>>> dqn_loss.make_value_estimator(ValueEstimators.TD0, gamma=0.9)

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源