评价此页

FusedMovingAvgObsFakeQuantize#

class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[source]#

定义一个用于观察张量的融合模块。

一个融合模块,用于观察输入张量(计算最小/最大值)、计算 scale/zero_point 以及对张量进行 fake_quantize。此模块使用与 MovingAverageMinMaxObserver 类似的计算方法来计算输入张量的最小/最大值,从而计算 scale/zero_point。观察者中的 qscheme 参数用于区分对称/仿射量化方案。

此模块的输出为 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale

类似于 FakeQuantize,并接受与基类相同的属性。