快捷方式

torchaudio.prototype.models.conformer_wav2vec2_base

torchaudio.prototype.models.conformer_wav2vec2_base(extractor_input_dim: int = 64, extractor_output_dim: int = 256, encoder_projection_dropout: float = 0.0) Wav2Vec2Model[源代码]

已弃用

警告

此函数已被弃用。它将在 2.9 版本中移除。此弃用是由于一项大型重构工作,旨在将 TorchAudio 迁移到维护阶段。有关更多信息,请参阅 https://github.com/pytorch/audio/issues/3902

根据《*Conformer-Based Slef-Supervised Learning for Non-Speech Audio Tasks*》构建 Conformer Wav2Vec2 模型(“small”架构) [Srivastava et al., 2022]

参数
  • extractor_input_dim (int, optional) – 特征提取器的输入维度。(默认值:64)

  • extractor_output_dim (int, optional) – 特征提取器的输出维度。(默认值:256)

  • encoder_projection_dropout (float, optional) – 特征投影后应用的 Dropout 概率。(默认值:0.0)

返回

生成的具有 Conformer 编码器和 base 配置的 wav2vec2 模型。

返回类型

Wav2Vec2Model

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源