目录

快捷方式

Int4WeightOnlyQATQuantizer¶

class torchao.quantization.qat.Int4WeightOnlyQATQuantizer(groupsize: int = 256, inner_k_tiles: Optional[int] = 8, precision: dtype = torch.bfloat16, scales_precision: dtype = torch.bfloat16)[源代码]¶: 用于对模型执行 QAT 的量化器，其中线性层具有按通道分组的 int4 伪量化权重。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源