SoftUpdate¶
- class torchrl.objectives.SoftUpdate(loss_module: DQNLoss | DDPGLoss | SACLoss | REDQLoss | TD3Loss, *, eps: float | None = None, tau: float | None = None)[源代码]¶
用于 Double DQN/DDPG 中目标网络更新的软更新类。
这在“CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING”中提出,https://arxiv.org/pdf/1509.02971.pdf
必须指定一个且仅一个衰减因子(tau 或 eps)。