目录

快捷方式

SoftUpdate¶

class torchrl.objectives.SoftUpdate(loss_module: DQNLoss | DDPGLoss | SACLoss | REDQLoss | TD3Loss, *, eps: float | None = None, tau: float | None = None)[源代码]¶

用于 Double DQN/DDPG 中目标网络更新的软更新类。

该方法在“CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING”中提出，https://arxiv.org/pdf/1509.02971.pdf

只能指定一个衰减因子（tau 或 eps）。

参数:

loss_module (DQNLoss 或 DDPGLoss) – 需要更新目标网络的目标模块。

eps (scalar) –

更新方程中的 epsilon：.. math

\theta_t = \theta_{t-1} * \epsilon + \theta_t * (1-\epsilon)

与 tau 互斥。

tau (scalar) – Polyak tau。它等于 1-eps，并且与 eps 互斥。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源