快捷方式

MultiThreadedEnvWrapper

torchrl.envs.MultiThreadedEnvWrapper(*args, **kwargs)[源代码]

用于 envpool 的多线程环境的包装器。

GitHub: https://github.com/sail-sg/envpool

论文: https://arxiv.org/abs/2206.10558

参数:
  • env (envpool.python.envpool.EnvPoolMixin) – 要包装的 envpool。

  • categorical_action_encoding (bool, optional) – 如果为 True,则分类规格将转换为 TorchRL 的等效规格 (torchrl.data.Categorical),否则将使用独热编码 (torchrl.data.OneHot)。默认为 False

关键字参数:
  • disable_env_checker (bool, optional) – 仅适用于 gym > 0.24。如果为 True (这些版本默认为此值),则不会运行环境检查器。

  • frame_skip (int, optional) – 如果提供,表示同一个动作需要重复多少步。返回的观测值将是序列的最后一个观测值,而奖励将是跨步骤的奖励总和。

  • device (torch.device, optional) – 如果提供,则数据将被转换为该设备。默认为 torch.device("cpu")

  • allow_done_after_reset (bool, optional) – 如果为 True,则在调用 reset() 后,允许环境立即完成。默认为 False

变量:

batch_size – 同时运行的环境数量。

示例

>>> import envpool
>>> from torchrl.envs import MultiThreadedEnvWrapper
>>> env_base = envpool.make(
...     task_id="Pong-v5", env_type="gym", num_envs=4, gym_reset_return_info=True
... )
>>> env = MultiThreadedEnvWrapper(envpool_env)
>>> env.reset()
>>> env.rand_step()

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源