评价此页

torch.nn.utils.parametrizations.weight_norm#

torch.nn.utils.parametrizations.weight_norm(module, name='weight', dim=0)[source]#

对给定模块中的参数应用权重归一化。

w=gvv\mathbf{w} = g \dfrac{\mathbf{v}}{\|\mathbf{v}\|}

权重归一化是一种重参数化方法,它将权重张量的幅度和方向分离开。这用两个参数替换了由 name 指定的参数:一个指定幅度,一个指定方向。

默认情况下,当 dim=0 时,范数是针对每个输出通道/平面独立计算的。要计算整个权重张量的范数,请使用 dim=None

请参见 https://arxiv.org/abs/1602.07868

参数
  • module (Module) – 包含的模块

  • name (str, optional) – 权重参数的名称

  • dim (int, optional) – 计算范数的维度

返回

带有权重归一化钩的原始模块

示例

>>> m = weight_norm(nn.Linear(20, 40), name='weight')
>>> m
ParametrizedLinear(
  in_features=20, out_features=40, bias=True
  (parametrizations): ModuleDict(
    (weight): ParametrizationList(
      (0): _WeightNorm()
    )
  )
)
>>> m.parametrizations.weight.original0.size()
torch.Size([40, 1])
>>> m.parametrizations.weight.original1.size()
torch.Size([40, 20])