快捷方式

KernelPreference

class torchao.quantization.quantize_.common.KernelPreference(value, names=None, *, module=None, qualname=None, type=None, start=1, boundary=None)[来源]

用于指定用于量化、矩阵乘法或其他量化张量的计算操作的内核组的枚举。

可以在 torchao/quantization/quantize_/workflows 下的张量子类实现中找到选项如何影响选定内核的示例

AUTO = 'auto'

使用 torch 原生的量化和量化 mm 内核

TORCH = 'torch'

使用 fbgemm 量化和量化 mm 内核,需要 fbgemm_gpu_genai 库

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源