BinarizeReward¶
- class torchrl.envs.transforms.BinarizeReward(in_keys: Sequence[NestedKey] | None = None, out_keys: Sequence[NestedKey] | None = None)[source]¶
将奖励映射为二元值(如果奖励为 null 则为 0,否则为 1)。
- 参数:
in_keys (List[NestedKey]) – 输入键
out_keys (List[NestedKey], optional) – 输出键。默认为
in_keys
的值。dtype (torch.dtype, optional) – 二值化奖励的数据类型。默认为
torch.int8
。
- transform_reward_spec(reward_spec: TensorSpec) TensorSpec [source]¶
转换奖励的 spec,使其与变换映射匹配。
- 参数:
reward_spec (TensorSpec) – 变换前的 spec
- 返回:
转换后的预期规范