评价此页

量化#

创建日期:2019年10月9日 | 最后更新日期:2025年12月22日

我们正在将所有与量化相关的开发集中到 torchao 中,请查看我们的新文档页面:https://docs.pytorch.ac.cn/ao/stable/index.html

现有量化流程的计划:1. Eager 模式量化(torch.ao.quantization.quantize, torch.ao.quantization.quantize_dynamic),请迁移至使用 torchao Eager 模式的 quantize_ API。

2. FX 图模式量化(torch.ao.quantization.quantize_fx.prepare_fx, torch.ao.quantization.quantize_fx.convert_fx),请迁移至使用 torchao pt2e 量化 API(torchao.quantization.pt2e.quantize_pt2e.prepare_pt2e, torchao.quantization.pt2e.quantize_pt2e.convert_pt2e)。

3. pt2e 量化已迁移至 torchao (pytorch/ao),更多详情请参阅 pytorch/ao#2259

如果没有阻塞性问题,我们计划在 2.10 版本中删除 torch.ao.quantization;若存在阻塞问题,则在所有阻塞问题解决后的最早 PyTorch 版本中将其删除。

量化 API 参考(由于 API 仍为公开状态,因此保留)#

量化 API 参考 包含了量化 API 的文档,例如量化传递(quantization passes)、量化张量运算以及受支持的量化模块和函数。

torch.ao.ns.fx.utils.compute_sqnr(x, y)[源码]#
torch.ao.ns.fx.utils.compute_normalized_l2_error(x, y)[源码]#
torch.ao.ns.fx.utils.compute_cosine_similarity(x, y)[源码]#