MultiThreadedEnv¶
- torchrl.envs.MultiThreadedEnv(*args, **kwargs)[source]¶
基于 EnvPool 的环境的多线程执行。
GitHub: https://github.com/sail-sg/envpool
论文: https://arxiv.org/abs/2206.10558
这是 ParallelEnv 的一种替代方案,基于多线程。它更快,因为它不需要新的进程创建,但灵活性较低,因为它只支持 EnvPool 库中实现的环境。目前,它仅支持同步执行模式,当批处理大小等于工作程序数量时,请参阅 https://envpool.readthedocs.io/en/latest/content/python_interface.html#batch-size。
- 参数:
num_workers (int) – 同时运行的环境数量。将与 ~.batch_size 的内容相同。
env_name (str) – 要构建的环境的名称。
- 关键字参数:
create_env_kwargs (Dict[str, Any], optional) – 要传递给 envpool 环境构造函数的 kwargs。
categorical_action_encoding (bool, optional) – 如果为
True
,则分类规范将转换为 TorchRL 的等效项(torchrl.data.Categorical
),否则将使用独热编码(torchrl.data.OneHot
)。默认为False
。disable_env_checker (bool, optional) – 仅适用于 gym > 0.24。如果为
True
(这些版本的默认值),则不会运行环境检查器。frame_skip (int, optional) – 如果提供,表示要重复相同的动作多少步。返回的观察将是该序列的最后一个观察,而奖励将是跨步的奖励总和。
device (torch.device, optional) – 如果提供,将数据转换为该设备。默认为
torch.device("cpu")
。allow_done_after_reset (bool, optional) – 如果为
True
,则在调用reset()
后立即容忍环境完成。默认为False
。
示例
>>> env = MultiThreadedEnv(num_workers=3, env_name="Pendulum-v1") >>> env.reset() >>> env.rand_step() >>> env.rollout(5) >>> env.close()