评价此页

linear#

class torch.ao.nn.quantized.functional.linear(input, weight, bias=None, scale=None, zero_point=None)[source]#

对输入的量化数据应用线性变换: y=xAT+by = xA^T + b。 请参阅 Linear

注意

当前的实现会在每次调用时打包权重,这会影响性能。如果您想避免这种开销,请使用 Linear

参数
  • input (Tensor) – 类型为 torch.quint8 的量化输入

  • weight (Tensor) – 类型为 torch.qint8 的量化权重

  • bias (Tensor) – None 或 fp32 偏置,类型为 torch.float

  • scale (double) – 输出尺度。如果为 None,则从输入尺度推导

  • zero_point (python:long) – 输出零点。如果为 None,则从输入零点推导

返回类型

张量

形状
  • 输入: (N,,in_features)(N, *, in\_features),其中 * 表示任意数量的附加维度

  • 权重: (out_features,in_features)(out\_features, in\_features)

  • 偏置: (out_features)(out\_features)

  • 输出: (N,,out_features)(N, *, out\_features)