目录

快捷方式

PackingFormat¶

class torchao.quantization.quantize_.common.PackingFormat(value, names=None, *, module=None, qualname=None, type=None, start=1, boundary=None)[源代码]¶

torchao 中 Tensor 子类的量化数据的打包格式，表示值如何在量化数据中打包和布局。

MARLIN_SPARSE = 'marlin_sparse'¶: 解包表示子字节量化数据存储为 int8。

PLAIN = 'plain'¶: preshuffled 指的是 fbgemm 内核使用的预混淆格式。

PRESHUFFLED = 'preshuffled'¶: marlin_sparse 指的是 marlin 内核使用的格式，仅支持对称量化。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源