Torch-TensorRT¶
用于 NVIDIA GPU 的 PyTorch 推理代码的框架内编译¶
Torch-TensorRT 是一个 PyTorch 推理编译器,通过 NVIDIA 的 TensorRT 深度学习优化器和运行时,针对 NVIDIA GPU。它支持通过 torch.compile 接口的即时 (JIT) 编译工作流以及提前 (AOT) 编译工作流。Torch-TensorRT 无缝集成到 PyTorch 生态系统中,支持将优化的 TensorRT 代码与标准 PyTorch 代码进行混合执行。
更多信息 / 系统架构
入门指南¶
用户指南¶
教程¶
Dynamo 前端¶
TorchScript 前端¶
FX 前端¶
模型库¶
torch_export_gpt2
Python API 文档¶
C++ API 文档¶
namespace_torch_tensorrt__ptq