快捷方式

torchaudio.functional.merge_tokens

torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) List[TokenSpan][源代码]

移除给定的 CTC token 序列中的重复 token 和空白 token。

参数
  • tokens (Tensor) – 由 forced_align() 返回的对齐 token(未批处理)。形状:(time, )

  • scores (Tensor) – 由 forced_align() 返回的对齐分数(未批处理)。形状:(time, )。在计算 token 大小的分数时,给定分数会跨越相应的 time 跨度进行平均。

返回

TokenSpan 列表

示例

>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths)
>>> token_spans = merge_tokens(aligned_tokens[0], scores[0])
使用 merge_tokens 的教程
CTC forced alignment API tutorial

CTC 强制对齐 API 教程

CTC 强制对齐 API 教程
Forced alignment for multilingual data

多语言数据的强制对齐

多语言数据的强制对齐

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源