choose_qparams_affine_with_min_max¶
- torchao.quantization.choose_qparams_affine_with_min_max(min_val: Tensor, max_val: Tensor, mapping_type: MappingType, block_size: Tuple[int, ...], target_dtype: dtype, quant_min: Optional[int] = None, quant_max: Optional[int] = None, eps: Optional[float] = None, scale_dtype: Optional[dtype] = None, zero_point_dtype: Optional[dtype] = None, preserve_zero: bool = True, zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT) Tuple[Tensor, Tensor] [源码]¶
与
choose_qparams_affine()
算子类似,但直接传入 min_val 和 max_val 而不是从中派生。这用于静态量化中的观察器,其中 min_val 和 max_val 可以通过跟踪校准数据集中的所有数据来获得。:param 与
choose_qparams_affine()
几乎相同。有一个: :difference: :不传入 input Tensor 并用它来计算 min_val/max_val: :param: :param: 然后是 scale/zero_point:: :param: 我们直接传入 min_val/max_val: