torchaudio.prototype.models.emformer_hubert_base¶

torchaudio.prototype.models.emformer_hubert_base(extractor_input_dim: int = 80, extractor_output_dim: int = 128, encoder_dropout: float = 0.1, aux_num_out: Optional[int] = None) → Wav2Vec2Model[源代码]¶

已弃用

警告

此函数已被弃用。它将在 2.9 版本中移除。此弃用是大型重构工作的一部分，旨在将 TorchAudio 迁移到维护阶段。有关更多信息，请参阅 https://github.com/pytorch/audio/issues/3902。

构建带有 20 个 Emformer 层的 Emformer HuBERT 模型。

参数

extractor_input_dim (int, 可选) – 特征提取器的输入维度。(默认：80)
extractor_output_dim (int, 可选) – 特征提取器之后的输出维度。(默认：128)
encoder_dropout (float, 可选) – Emformer 中的 dropout 概率。(默认：0.1)
aux_num_out (int 或 None, 可选) – 用于微调的 aux 层的输出维度。(默认：None)

返回

生成的 torchaudio.models.Wav2Vec2Model 模型，带有 torchaudio.models.Emformer 编码器。

返回类型

Wav2Vec2Model

torchaudio.prototype.models.emformer_hubert_base¶

文档

教程

资源