ConstantKLController¶ class torchrl.data.ConstantKLController(*, kl_coef: float | None = None, model: nn.Module | None = None)[source]¶ Constant KL Controller。 此控制器在收到更新值时保持固定的系数,无论其值如何。 关键字参数: kl_coef(float)– 在计算奖励时用于乘以 KL 的系数。 model(nn.Module, optional)– 需要控制的包装模型。必须具有 "kl_coef" 属性。如果提供,则 "kl_coef" 将就地更新。