tensordict.nn.distributions.AddStateIndependentNormalScale¶

class tensordict.nn.distributions.AddStateIndependentNormalScale(scale_shape: Optional[Union[Size, int, tuple]] = None, *, scale_mapping: str = 'exp', scale_lb: Number = 0.0001, device: Optional[device] = None, make_param: bool = True, init_value: float = 0.0)¶

一个 nn.Module，用于添加可训练的、与状态无关的尺度参数。

尺度参数使用指定的 scale_mapping 映射为正值。

参数:

scale_shape (torch.Size 或 等价物, 可选) – 尺度参数的形状。默认为 torch.Size(())。

关键字参数:

scale_mapping (str, 可选) – 用于标准差的正向映射函数。默认为 "exp"，可选值： "softplus"、 "exp"、 "relu"、 "biased_softplus_1"。
scale_lb (Number, 可选) – 方差可以取的最小值。默认为 1e-4。
device (torch.device, 可选) – 模块的设备。
make_param (bool, 可选) – 尺度是参数（True）还是缓冲区（False）。默认为 True。
init_value (float, 可选) – 状态无关尺度的初始值。默认为 0.0。

示例

>>> from torch import nn
>>> import torch
>>> num_outputs = 4
>>> module = nn.Linear(3, num_outputs)
>>> module_normal = AddStateIndependentNormalScale(num_outputs)
>>> tensor = torch.randn(3)
>>> loc, scale = module_normal(module(tensor))
>>> print(loc.shape, scale.shape)
torch.Size([4]) torch.Size([4])
>>> assert (scale > 0).all()
>>> # with modules that return more than one tensor
>>> module = nn.LSTM(3, num_outputs)
>>> module_normal = AddStateIndependentNormalScale(num_outputs)
>>> tensor = torch.randn(4, 2, 3)
>>> loc, scale, others = module_normal(*module(tensor))
>>> print(loc.shape, scale.shape)
torch.Size([4, 2, 4]) torch.Size([4, 2, 4])
>>> assert (scale > 0).all()

tensordict.nn.distributions.AddStateIndependentNormalScale¶

文档

教程

资源