Delta¶

class torchrl.modules.Delta(param: torch.Tensor, atol: float = 1e-06, rtol: float = 1e-06, batch_shape: torch.Size | Sequence[int] = None, event_shape: torch.Size | Sequence[int] = None)[source]¶

Delta 分布。

参数:

param (torch.Tensor) – Delta 分布的参数；
atol (数字, 可选) – 用于判断张量是否匹配分布参数的绝对容差；默认为 1e-6
rtol (数字, 可选) – 用于判断张量是否匹配分布参数的相对容差；默认为 1e-6
batch_shape (torch.Size, 可选) – batch 形状；
event_shape (torch.Size, optional) – 结果的形状。

expand(batch_shape: Size, _instance=None)[source]¶

返回一个新的分布实例（或填充由派生类提供的现有实例），其中批处理维度已扩展到 batch_shape。此方法调用分布参数上的 expand。因此，这不会为扩展的分布实例分配新内存。此外，当实例首次创建时，这也不会在 __init__.py 中重复任何参数检查或参数广播。

参数:

batch_shape (torch.Size) – 所需的扩展大小。
_instance – 由需要覆盖 .expand 的子类提供的新的实例。

返回:

批处理维度已扩展到 batch_size 的新的分布实例。

log_prob(value: Tensor) → Tensor[source]¶

返回在 value 处评估的概率密度/质量函数的对数。

参数:: value (Tensor) –

property mean: Tensor¶: 返回分布的均值。

property mode: Tensor¶: 返回分布的众数。

rsample(size=None) → Tensor[source]¶: 生成 sample_shape 形状的重参数化样本，如果分布参数是批处理的，则生成 sample_shape 形状的重参数化样本批次。

sample(size=None) → Tensor[source]¶: 生成 sample_shape 形状的样本，如果分布参数是批处理的，则生成 sample_shape 形状的样本批次。

Delta¶

文档

教程

资源