Wav2Vec2FABundle.Aligner¶
- class torchaudio.pipelines.Wav2Vec2FABundle.Aligner¶
对齐器的接口
方法¶
__call__¶
- abstract Aligner.__call__(emission: Tensor, tokens: List[List[int]]) List[List[TokenSpan]] ¶
生成带时间戳的 token 序列列表
- 参数
emission (Tensor) – 对数域的 token 概率分布序列。形状:(time, tokens)。
tokens (python:integer sequence 列表) – token 化的文本。来自
torchaudio.pipelines.Wav2Vec2FABundle.Tokenizer
的输出。
- 返回
带有时间戳和分数的 token。
- 返回类型
(TokenSpan 序列列表)