快捷方式

PackingFormat

class torchao.quantization.quantize_.common.PackingFormat(value, names=None, *, module=None, qualname=None, type=None, start=1, boundary=None)[源代码]

torchao 中 Tensor 子类的量化数据的打包格式,表示值如何在量化数据中打包和布局。

MARLIN_SPARSE = 'marlin_sparse'

解包表示子字节量化数据存储为 int8。

PLAIN = 'plain'

preshuffled 指的是 fbgemm 内核使用的预混淆格式。

PRESHUFFLED = 'preshuffled'

marlin_sparse 指的是 marlin 内核使用的格式,仅支持对称量化。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源