FakeQuantize#

class torch.ao.quantization.fake_quantize.FakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=None, quant_max=None, is_dynamic=False, **observer_kwargs)[源代码]#

在训练时模拟量化和反量化操作。

此模块的输出由下式给出

x_out = (
    clamp(round(x / scale + zero_point), quant_min, quant_max) - zero_point
) * scale

is_dynamic 指示 fake quantie 是动态量化算子 (choose_qparams -> q -> dq) 还是静态量化算子 (q -> dq) 的占位符
scale 定义了用于量化的比例因子。
zero_point 指定了浮点数中的 0 映射到的量化值
fake_quant_enabled 控制对张量的伪量化应用，请注意统计信息仍可被更新。
observer_enabled 控制张量的统计信息收集
dtype 指定了使用伪量化进行模拟的量化数据类型，
允许的值为 torch.qint8 和 torch.quint8。

参数

observer (module) – 用于观察输入张量上的统计信息并计算比例因子和零点的模块。
observer_kwargs (optional) – observer 模块的参数

变量

activation_post_process (Module) – 用户提供的模块，用于收集输入张量上的统计信息并提供计算比例因子和零点的方法。

FakeQuantize#

文档

教程

资源