快捷方式

Float8DynamicActivationInt4WeightConfig

class torchao.quantization.Float8DynamicActivationInt4WeightConfig(packing_format: PackingFormat = 'preshuffled')[源代码]

应用于线性层的 float8 动态每行量化和 int4 每组权重量化的配置(目前仅支持 group_size 128,因为底层内核仅支持 128 及以上,且没有使其更大的优势)。

参数:

packing_format – 权重如何打包,仅支持 preshuffled

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源