quantize_affine¶

torchao.quantization.quantize_affine(input: Tensor, block_size: Tuple[int, ...], scale: Tensor, zero_point: Optional[Tensor], output_dtype: dtype, quant_min: Optional[Union[int, float]] = None, quant_max: Optional[Union[int, float]] = None) → Tensor[源码]¶

参数:

input (torch.Tensor) – 原始的 float32、float16 或 bfloat16 张量
block_size – (Tuple[int, …]): 量化的粒度，这表示共享同一 qparam 的张量元素的尺寸。例如，当尺寸与输入张量维度相同时，我们使用每张量（per tensor）量化
scale (float) – 仿射量化的量化参数
zero_point (int) – 仿射量化的量化参数
output_dtype (torch.dtype) – 输出张量所需的 dtype（例如 torch.uint8）
quant_min (Optional[int]) – 输出张量的最小量化值，如果未指定，则将从 dtype 派生
quant_max (Optional[int]) – 输出张量的最大量化值，如果未指定，则将从 dtype 派生

注意

block_size 如何表示不同的粒度？例如，我们有一个尺寸为 (3, 3, 10, 10) 的张量，下表显示了 block_size 如何表示不同的粒度

粒度类型 | block_size
每张量（per_tensor） | (3, 3, 10, 10) 每轴（per_axis，axis=0） | (1, 3, 10, 10) 每轴（per_axis，axis=1） | (3, 1, 10, 10)

每组（per_group，groupsize=2） | (3, 3, 10, 2) 每组（per_group，groupsize=2）对于 axis = 3 | (3, 3, 2, 10)

输出: 具有所需 dtype 的量化张量

quantize_affine¶

文档

教程

资源