MultiThreadedEnv¶

torchrl.envs.MultiThreadedEnv(*args, **kwargs)[源代码]¶

基于 EnvPool 的环境的多线程执行。

GitHub: https://github.com/sail-sg/envpool

这是 ParallelEnv 的一个替代方案，基于多线程。它速度更快，因为它不需要启动新进程，但灵活性较低，因为它只支持 EnvPool 库中实现的环境。目前，它只支持同步执行模式，当批处理大小等于工作线程数量时，请参阅 https://envpool.readthedocs.io/en/latest/content/python_interface.html#batch-size。

参数:

num_workers (int) – 同时运行的环境数量。将与 ~.batch_size 的内容相同。
env_name (str) – 要构建的环境的名称。

关键字参数:

create_env_kwargs (Dict[str, Any], optional) – 将传递给 envpool 环境构造函数的 kwargs。
categorical_action_encoding (bool, optional) – 如果为 True，则分类规范将转换为 TorchRL 等效项 (torchrl.data.Categorical)，否则将使用独热编码 (torchrl.data.OneHot)。默认为 False。
disable_env_checker (bool, optional) – 仅适用于 gym > 0.24。如果为 True (这些版本的默认值)，则不会运行环境检查器。
frame_skip (int, optional) – 如果提供，表示相同的动作需要重复多少步。返回的观察值将是序列的最后一个观察值，而奖励将是跨步骤的奖励总和。
device (torch.device, optional) – 如果提供，数据将被转换到的设备。默认为 torch.device("cpu")。
allow_done_after_reset (bool, optional) – 如果为 True，则允许在调用 reset() 后立即将环境设置为 done。默认为 False。

示例

>>> env = MultiThreadedEnv(num_workers=3, env_name="Pendulum-v1")
>>> env.reset()
>>> env.rand_step()
>>> env.rollout(5)
>>> env.close()

MultiThreadedEnv¶

文档

教程

资源