quantize_dynamic#

class torch.ao.quantization.quantize_dynamic(model, qconfig_spec=None, dtype=torch.qint8, mapping=None, inplace=False)[源代码]#

将浮点模型转换为动态（即仅权重）量化模型。

用动态权重仅量化版本替换指定的模块，并输出量化模型。

最简单的用法是提供 dtype 参数，可以是 float16 或 qint8。默认情况下，对具有大权重尺寸的层（即 Linear 和 RNN 变体）执行权重仅量化。

可以通过 qconfig 和 mapping 实现细粒度控制，其作用与 quantize() 类似。如果提供了 qconfig，则会忽略 dtype 参数。

参数

model – 输入模型
qconfig_spec –
Either
- 一个字典，从子模块的名称或类型映射到量化配置，qconfig 应用于给定模块的所有子模块，除非为子模块指定了 qconfig（当子模块已具有 qconfig 属性时）。字典中的条目需要是 QConfig 实例。
- 一组类型和/或子模块名称，用于应用动态量化，在这种情况下，dtype 参数用于指定位宽。
inplace – 就地执行模型转换，原始模块将被修改
mapping – 将子模块的类型映射到对应的动态量化版本类型，子模块需要被替换成该类型。

文档