目录

快捷方式

HardUpdate¶

class torchrl.objectives.HardUpdate(loss_module: DQNLoss | DDPGLoss | SACLoss | TD3Loss, *, value_network_update_interval: float = 1000)[源代码]¶

用于 Double DQN/DDPG 中目标网络更新的硬更新类（与软更新相对）。

这在原始的 Double DQN 论文中被提出：“Deep Reinforcement Learning with Double Q-learning”，https://arxiv.org/abs/1509.06461。

参数:: loss_module (DQNLoss 或 DDPGLoss) – 应更新目标网络的损失模块。
关键字参数:: value_network_update_interval (标量) – 目标网络应更新的频率。默认值：1000

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源