torchaudio.functional.merge_tokens¶
- torchaudio.functional.merge_tokens(tokens: Tensor, scores: Tensor, blank: int = 0) List[TokenSpan] [源代码]¶
移除给定的 CTC token 序列中的重复 token 和空白 token。
- 参数
tokens (Tensor) – 由
forced_align()
返回的对齐 token(未批处理)。形状:(time, )。scores (Tensor) – 由
forced_align()
返回的对齐分数(未批处理)。形状:(time, )。在计算 token 大小的分数时,给定分数会跨越相应的 time 跨度进行平均。
- 返回
TokenSpan 列表
示例
>>> aligned_tokens, scores = forced_align(emission, targets, input_lengths, target_lengths) >>> token_spans = merge_tokens(aligned_tokens[0], scores[0])
- 使用
merge_tokens
的教程