评价此页

QConfig#

class torch.ao.quantization.qconfig.QConfig(activation, weight)[source]#

描述如何通过为激活和权重分别提供设置(观察者类)来量化层或网络的一部分。

请注意,QConfig 需要包含观察者 **类**(如 MinMaxObserver)或在调用时返回实例的可调用对象,而不是具体的观察者实例本身。量化准备函数将为每个层多次实例化观察者。

观察者类通常具有合理的默认参数,但可以使用 with_args 方法(行为类似于 functools.partial)覆盖它们。

my_qconfig = QConfig(
    activation=MinMaxObserver.with_args(dtype=torch.qint8),
    weight=default_observer.with_args(dtype=torch.qint8),
)