评价此页

FusedMovingAvgObsFakeQuantize#

class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[source]#

定义一个融合模块来观察张量。

用于观察输入张量(计算最小/最大值)、计算 scale/zero_point 并对张量进行 fake_quantize 的融合模块。该模块使用类似于 MovingAverageMinMaxObserver 的计算方式处理输入,以计算最小/最大值来得到 scale/zero_point。observer 中的 qscheme 参数用于区分对称/仿射量化方案。

该模块的输出为 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale

FakeQuantize 类似,并接受与基类相同的属性。