快捷方式

cuda_ctc_decoder

torchaudio.models.decoder.cuda_ctc_decoder(tokens: Union[str, List[str]], nbest: int = 1, beam_size: int = 10, blank_skip_threshold: float = 0.95) CUCTCDecoder[源代码]

已弃用

警告

此函数已被弃用。它将在 2.9 版本中删除。此弃用是旨在将 TorchAudio 迁移到维护阶段的大规模重构工作的一部分。更多信息请参阅 https://github.com/pytorch/audio/issues/3902

构建一个 CUCTCDecoder 的实例。

参数
  • tokens (strList[str]) – 包含有效 token 的文件或列表。如果使用文件,则预期的格式是映射到同一索引的 token 必须在同一行

  • beam_size (int, 可选) – 每次解码步骤后要保留的假设的最大数量(默认值:10)

  • nbest (int) – 要返回的最佳解码数量

  • blank_id (int) – 对应空白符号的 token ID。

  • blank_skip_threshold (float) – 如果 log_prob(blank) > log(blank_skip_threshold),则跳过帧以加速解码(默认值:0.95)。

返回

解码器

返回类型

CUCTCDecoder

示例
>>> decoder = cuda_ctc_decoder(
>>>     vocab_file="tokens.txt",
>>>     blank_skip_threshold=0.95,
>>> )
>>> results = decoder(log_probs, encoder_out_lens) # List of shape (B, nbest) of Hypotheses
使用 cuda_ctc_decoder 的教程
ASR Inference with CUDA CTC Decoder

使用 CUDA CTC 解码器进行 ASR 推理

使用 CUDA CTC 解码器进行 ASR 推理

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源