AdditiveGaussianModule¶
- class torchrl.modules.AdditiveGaussianModule(*args, **kwargs)[来源]¶
加性高斯 PO 模块。
- 参数:
spec (TensorSpec) – 用于采样动作的 spec。采样到的动作将在探索后投影到有效的动作空间。
sigma_init (scalar, optional) – 初始 epsilon 值。默认值:1.0
sigma_end (scalar, optional) – 最终 epsilon 值。默认值:0.1
annealing_num_steps (int, optional) – sigma 值达到
sigma_end
值所需的步数。默认值:1000mean (
float
, optional) – 每个输出元素的正态分布的均值。默认值:0.0std (
float
, optional) – 每个输出元素的正态分布的标准差。默认值:1.0
- 关键字参数:
action_key (NestedKey, optional) – 如果策略模块有多个输出键,其输出 spec 将是 Composite 类型。需要知道在哪里找到动作 spec。默认值:“action”
safe (bool) – 如果为
True
,则给出动作空间限制的超出范围的动作将根据TensorSpec.project
的启发式方法进行投影。默认值:Falsedevice (torch.device, optional) – 必须存储 buffer 的设备。
注意
务必在训练循环中调用
step()
来更新探索因子。由于很难捕获此遗漏,如果遗漏此调用将不会发出任何警告或异常!