快捷方式

CUCTCDecoder

class torchaudio.models.decoder.CUCTCDecoder[source]

已弃用

警告

此类从 2.8 版本开始弃用。它将在 2.9 版本中移除。此弃用是大型重构工作的一部分,旨在将 TorchAudio 迁移到维护阶段。更多信息请参阅 https://github.com/pytorch/audio/issues/3902

CUDA CTC 束搜索解码器。

This feature supports the following devices: CUDA
注意

要构建解码器,请使用工厂函数 cuda_ctc_decoder()

使用 CUCTCDecoder 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理

方法

__call__

CUCTCDecoder.__call__(log_prob: Tensor, encoder_out_lens: Tensor)[source]
参数
  • log_prob (torch.FloatTensor) – GPU 张量,形状为 (batch, frame, num_tokens),存储标签的概率分布序列;对声学模型输出进行 log_softmax。

  • lengths (dpython:type torch.python:int32) – GPU 张量,形状为 (batch, ),存储批次中每个音频序列在时间轴上的有效长度。

返回

批次中每个音频序列的已排序最佳假设列表。

返回类型

List[List[CUCTCHypothesis]]

支持结构

CUCTCHypothesis

class torchaudio.models.decoder.CUCTCHypothesis(tokens: List[int], words: List[str], score: float)[source]

已弃用

警告

此类从 2.8 版本开始弃用。它将在 2.9 版本中移除。此弃用是大型重构工作的一部分,旨在将 TorchAudio 迁移到维护阶段。更多信息请参阅 https://github.com/pytorch/audio/issues/3902

表示由 CUCTC 束搜索解码器 CUCTCDecoder 生成的假设。

使用 CUCTCHypothesis 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理
tokens: List[int]

预测的 token ID 序列。形状为 (L, ),其中 L 是输出序列的长度。

words: List[str]

预测的 token 列表。与建模单元对齐。

score: float

与假设对应的分数。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源