HabitatEnv¶

torchrl.envs.HabitatEnv(*args, **kwargs)[源代码]¶

Habitat 环境的包装器。

此类当前用作占位符和兼容性安全措施。它的行为与 GymEnv 包装器完全相同。

参数:

env_name (str) – 要执行的环境。
categorical_action_encoding (bool, optional) – 如果为 True，则分类规范将转换为 TorchRL 等效项 (torchrl.data.Categorical)，否则将使用独热编码 (torchrl.data.OneHot)。默认为 False。

关键字参数:

from_pixels (bool, optional) – 如果为 True，则会尝试从环境中返回像素观察。默认情况下，这些观察将被写入 "pixels" 条目下。所使用的方法取决于 gym 的版本，并可能涉及 wrappers.pixel_observation.PixelObservationWrapper。默认为 False。
pixels_only (bool, optional) – 如果设置为 True，将只返回像素观察（默认在输出 tensordict 的 "pixels" 条目下）。如果设置为 False，当 from_pixels=True 时，将返回观察（例如，状态）和像素。默认为 True。
frame_skip (int, optional) – 如果提供，表示相同的动作需要重复多少步。返回的观察值将是序列的最后一个观察值，而奖励将是跨步骤的奖励总和。
device (torch.device, 可选) – 如果提供，则表示模拟将发生的设备。默认为 torch.device("cuda:0")。
batch_size (torch.Size, optional) – 环境的批次大小。应与所有观察、完成状态、奖励、动作和信息的前导维度匹配。默认为 torch.Size([])。
allow_done_after_reset (bool, optional) – 如果为 True，则允许在调用 reset() 后立即将环境设置为 done。默认为 False。

变量:

available_envs (List[str]) – 要构建的环境列表。

示例

>>> from torchrl.envs import HabitatEnv
>>> env = HabitatEnv("HabitatRenderPick-v0", from_pixels=True)
>>> env.rollout(3)

文档