评价此页

LazyLinear#

class torch.nn.LazyLinear(out_features, bias=True, device=None, dtype=None)[源代码]#

一个 torch.nn.Linear 模块,其中 in_features 会被推断。

在此模块中,weightbiastorch.nn.UninitializedParameter 类。它们将在第一次调用 forward 后初始化,然后该模块将成为一个常规的 torch.nn.Linear 模块。Linearin_features 参数将从 input.shape[-1] 推断。

有关延迟模块及其限制的更多文档,请查看 torch.nn.modules.lazy.LazyModuleMixin

参数
  • out_features (int) – 每个输出样本的大小

  • bias (UninitializedParameter) – 如果设置为 False,则该层将不学习加性偏置。默认值:True

变量
  • weight (torch.nn.parameter.UninitializedParameter) – 模块的可学习权重,形状为 (out_features,in_features)(\text{out\_features}, \text{in\_features})。值从 U(k,k)\mathcal{U}(-\sqrt{k}, \sqrt{k}) 初始化,其中 k=1in_featuresk = \frac{1}{\text{in\_features}}

  • bias (torch.nn.parameter.UninitializedParameter) – 模块的可学习偏置,形状为 (out_features)(\text{out\_features})。如果 biasTrue,则值从 U(k,k)\mathcal{U}(-\sqrt{k}, \sqrt{k}) 初始化,其中 k=1in_featuresk = \frac{1}{\text{in\_features}}

cls_to_become[源代码]#

别名:Linear

initialize_parameters(input)[源代码]#

根据 input 推断 in_features 并初始化参数。

reset_parameters()[源代码]#

根据 __init__ 中使用的初始化重置参数。