编写 Dynamo 转换器¶
Torch-TensorRT 中的 dynamo 转换器库位于 TensorRT/py/torch_tensorrt/dynamo/conversion
。
转换器实现¶
注册¶
转换器是一个用 torch_tensorrt.dynamo.dynamo_tensorrt_converter
装饰并遵循函数签名的函数
@torch_tensorrt.dynamo.conversion.dynamo_tensorrt_converter(torch.ops.aten.leaky_relu.default)
def leaky_relu_converter(
ctx: torch_tensorrt.dynamo.conversion.ConversionCtx,
target: Target,
args: Tuple[Argument, ...],
kwargs: Dict[str, Argument],
name: str,
) -> Union[tensorrt.ITensor, Sequence[tensorrt.ITensor]]:
装饰器接受多个参数
key
: 转换器实现的节点目标(例如,torch.ops.aten.leaky_relu.default)
enabled
: 转换器是否应作为可在转换器注册表中使用的转换器启用
capability_validator
: 一个 lambda,可以接收torch.fx.Node
并确定转换器是否可以正确处理此节点。如果验证器返回False
,子图分区器将确保此节点在编译图中在 PyTorch 中运行。
priority
: 允许开发人员覆盖转换器注册表中现有的转换器
转换器唯一需要的是键。
函数体负责获取网络的当前状态并添加下一个子图,以使用 TensorRT 操作执行装饰器中指定的 op。该函数提供参数,就像本机 PyTorch op 将提供的参数一样,增加了冻结 Tensor 属性的 numpy 数组或作为先前节点输出 Tensor 的 TensorRT ITensor 的情况,对应于图中中间操作的边/输出 Tensor。要确定预期类型以及转换器的返回类型,请查看要转换的 op 的定义。对于 aten
操作,此文件将是真实来源:https://github.com/pytorch/pytorch/blob/main/aten/src/ATen/native/native_functions.yaml 由于开发人员可能编写的许多转换器是较低级运算符的组合,因此无需在原始 TensorRT 中实现转换器,torch_tensorrt.dynamo.conversion.impl
子包包含许多操作的实现,可以链接这些操作以创建 TensorRT 子图。
ctx
: 编译器的当前状态。转换器主要操作 ctx.net,即正在构建的tensorrt.INetworkDefinition
。此结构中还提供了包括用户提供设置在内的其他元数据。
target
: 上述call_module
或call_function
中的目标键。例如:torch.ops.aten_.leaky_relu.default
。请注意,torch.ops.aten._leaky_relu
是OpOverloadPacket
,而torch.ops.aten_.leaky_relu.default
是OpOverload
。
args
: 传递给特定节点的参数(由torch_tensorrt.dynamo.conversion.TRTInterpreter
收集)。这些参数以及 kwargs 将用于构造表示 INetworkDefinition 中当前节点的特定 TensorRT 子图。
kwargs
: 传递给特定节点的参数(由torch_tensorrt.dynamo.conversion.TRTInterpreter
收集)。
name
: 包含目标名称的字符串
该函数预计返回 tensorrt.ITensor
或一些 tensorrt.ITensor
的集合,以便在 torch_tensorrt.dynamo.conversion.TRTInterpreter
中使用,匹配正在转换的操作的输出签名
能力验证¶
有些转换器有特殊情况需要考虑。在这些情况下,应该使用 capability_validators
通过 @dynamo_tensorrt_converter
注册转换器。我们通过 torch.ops.aten.embedding.default
来演示这一点。它有参数 - scale_grad_by_freq
和 sparse
,这些参数目前不支持。在这种情况下,我们可以编写验证器 embedding_param_validator
来实现给定这些参数时不支持转换器,并通过以下方式注册转换器:
类型契约¶
该函数预期遵循由签名确立的类型契约。这包括接受有效 PyTorch 类型 + numpy 数组(用于常量张量)和 TensorRT ITensor 的联合。如果转换器仅支持一部分类型,您还可以添加 torch_tensorrt.dynamo.conversion.converter_utils.enforce_tensor_types
,这允许您指定输入位置与这些输入可以采用的类型之间的字典映射。在可能的情况下,装饰器将转换输入以匹配这些类型,优先考虑提供的顺序。int
字典键将指代 args
中的位置参数。str
键将指代 kwargs
中的关键字参数。
示例:卷积
¶
默认的卷积转换器同时使用能力验证器和类型强制,以防止在不支持的情况下运行。能力验证器在分区期间运行,以确定特定的卷积节点是否可以转换为 TensorRT 或需要在 PyTorch 中运行。此处,验证器确保卷积不超过 3D。类型强制器将在调用转换器之前自动转换输入到转换器中支持的类型,从而限制了作者必须处理的案例数量。
@dynamo_tensorrt_converter(
torch.ops.aten.convolution.default, capability_validator=lambda conv_node: conv_node.args[7] in ([0], [0, 0], [0, 0, 0])
) # type: ignore[misc]
@enforce_tensor_types(
{
0: (TRTTensor,),
1: (np.ndarray, torch.Tensor, TRTTensor),
2: (np.ndarray, torch.Tensor, TRTTensor),
}
) # type: ignore[misc]
def aten_ops_convolution(
ctx: ConversionContext,
target: Target,
args: Tuple[Argument, ...],
kwargs: Dict[str, Argument],
name: str,
) -> Union[TRTTensor, Sequence[TRTTensor]]:
评估器¶
某些操作不会产生作为副作用的 TensorRT 子图。这些被称为评估器。
示例:
operator.getitem
评估器之所以这样分类,是因为它们不对图进行任何修改。这在
py/torch_tensorrt/dynamo/conversion/op_evaluators.py
中实现,并带有相应的capbility_validator
。操作码是operator.getitem
。
运算符分解¶
有一些转换器可以分解为 PyTorch 中的子操作,并且不需要单独的转换器注册。此类转换器可以通过分解来实现
示例:addmm
¶
分解通过 register_torch_trt_decomposition
装饰器注册。我们定义 addmm_replacement
并将其替换为 torch ops,这些 ops 将调用其相应的转换器。
@torch_tensorrt.dynamo.lowering.register_torch_trt_decomposition(torch.ops.aten.addmm)
def addmm_replacement(
input_: torch.Tensor, mat1: torch.Tensor, mat2: torch.Tensor, *, beta=1, alpha=1
) -> torch.Tensor:
return torch.add(
torch.mul(input_, beta), torch.mul(torch.matmul(mat1, mat2), alpha)
)
您可以通过编辑 torch_tensorrt.dynamo.lowering.torch_enabled_decompositions
和 torch_tensorrt.dynamo.lowering.torch_disabled_decompositions
来修改运行的分解。
注意:
torch_tensorrt.dynamo.lowering.torch_enabled_decompositions
和torch_tensorrt.dynamo.lowering.torch_disabled_decompositions
必须是不相交的集合,并且torch_tensorrt.dynamo.lowering
中已定义的分解将优先于 torch 降低操作。
大多数时候,这比实现转换器要容易得多。所以,如果可能,这应该是首先尝试的方法。