快捷方式

MarlinQQQTensor

class torchao.dtypes.MarlinQQQTensor(tensor_impl: AQTTensorImpl, block_size: Tuple[int, ...], shape: Size, quant_min: Optional[Union[int, float]] = None, quant_max: Optional[Union[int, float]] = None, zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT, dtype=None, strides=None)[源代码]

MarlinQQQ 量化张量子类,继承自 AffineQuantizedTensor 类。

要了解 _choose_qparams_and_quantize_affine_qqq、Marlin QQQ 量化的量化和反量化过程中发生的情况,请查看 https://github.com/pytorch/ao/blob/main/torchao/quantization/quant_primitives.py,并检查两个量化原始操作:_choose_qparams_and_quantize_affine_qqq 和 _dequantize_affine_qqq。

dequantize() Tensor[源代码]

给定一个量化张量,对其进行去量化并返回去量化的浮点张量。

classmethod from_hp_to_intx(input_float: Tensor, block_size: Tuple[int, ...], quant_min: Optional[int] = None, quant_max: Optional[int] = None, zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT, _layout: Optional[Layout] = None)[源代码]

将浮点张量转换为 Marlin QQQ 量化张量。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源