FusedMovingAvgObsFakeQuantize#

class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[source]#

定义一个融合模块来观察张量。

用于观察输入张量（计算最小/最大值）、计算 scale/zero_point 并对张量进行 fake_quantize 的融合模块。该模块使用类似于 MovingAverageMinMaxObserver 的计算方式处理输入，以计算最小/最大值来得到 scale/zero_point。observer 中的 qscheme 参数用于区分对称/仿射量化方案。

该模块的输出为 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale

与 FakeQuantize 类似，并接受与基类相同的属性。

FusedMovingAvgObsFakeQuantize#

文档

教程

资源