快捷方式

Delta

class torchrl.modules.Delta(param: torch.Tensor, atol: float = 1e-06, rtol: float = 1e-06, batch_shape: torch.Size | Sequence[int] = None, event_shape: torch.Size | Sequence[int] = None)[source]

Delta 分布。

参数:
  • param (torch.Tensor) – delta 分布的参数;

  • atol (数字, 可选) – 用于判断张量是否匹配分布参数的绝对容差;默认为 1e-6

  • rtol (数字, 可选) – 用于判断张量是否匹配分布参数的相对容差;默认为 1e-6

  • batch_shape (torch.Size, 可选) – 批次形状;

  • event_shape (torch.Size, optional) – 结果的形状。

expand(batch_shape: Size, _instance=None)[source]

返回一个新的分布实例(或填充由派生类提供的现有实例),其批次维度已扩展到 batch_shape。此方法调用分布参数上的 expand。因此,这不会为扩展的分布实例分配新内存。此外,这也不会在首次创建实例时在 __init__.py 中重复任何参数检查或参数广播。

参数:
  • batch_shape (torch.Size) – 所需的扩展大小。

  • _instance – 由需要覆盖 .expand 的子类提供的新的实例。

返回:

具有已扩展到 batch_size 的批次维度的新的分布实例。

log_prob(value: Tensor) Tensor[source]

返回在 value 处评估的概率密度/质量函数的对数。

参数:

value (Tensor) –

property mean: Tensor

返回分布的均值。

property mode: Tensor

返回分布的众数。

rsample(size=None) Tensor[source]

生成 sample_shape 形状的重参数化样本,如果分布参数是批处理的,则生成 sample_shape 形状的重参数化样本批次。

sample(size=None) Tensor[source]

生成 sample_shape 形状的样本,如果分布参数是批处理的,则生成 sample_shape 形状的样本批次。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源