目录

快捷方式

UIntXWeightOnlyConfig¶

class torchao.quantization.UIntXWeightOnlyConfig(dtype: dtype, group_size: int = 64, pack_dim: int = - 1, use_hqq: bool = False, set_inductor_config: bool = True)[源代码]¶

用于将 uintx 权重仅非对称逐组量化应用于线性层的配置，其中 x 是由 dtype 指定的位数，使用 uintx 量化。

参数:

dtype – torch.uint1 到 torch.uint7 的不足 1 字节的数据类型
group_size – 量化的参数，控制量化的粒度，尺寸越小粒度越细，默认为 64
pack_dim – 我们用于打包的维度，默认为 -1
use_hqq – 是使用 hqq 算法还是默认算法来量化权重
set_inductor_config – 如果为 True，则将 torchinductor 设置调整为推荐值。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源