快捷方式

ConformerWav2Vec2PretrainModel

class torchaudio.prototype.models.ConformerWav2Vec2PretrainModel(wav2vec2: Wav2Vec2Model, mask_generator: Module, negative_sampler: Module)[源代码]

已弃用

警告

此类已从 2.8 版本开始弃用。将在 2.9 版本中删除。此弃用是为将 TorchAudio 迁移到维护阶段的大规模重构工作的一部分。有关更多信息,请参阅 https://github.com/pytorch/audio/issues/3902

Conformer Wav2Vec2 预训练模型,用于从头开始训练。

注意

要构建模型,请使用其中一个工厂函数 conformer_wav2vec2_base()conformer_wav2vec2_large()

参数 (Args)
wav2vec2 (nn.Module)

基于 Conformer 的 Wav2Vec2 模型,包括特征提取器和 Conformer 编码器组件。

mask_generator (nn.Module)

在训练期间生成掩码预测的掩码生成器。

negative_sampler (nn.Module)

掩码后应用的负采样器。

方法

forward

ConformerWav2Vec2PretrainModel.forward(features: Tensor, audio_lengths: Optional[Tensor] = None) Tuple[Tensor, Optional[Tensor], Tensor, Tensor][源代码]
参数
  • features (Tensor) – 形状为 (batch, frame, dim) 的音频特征张量。

  • audio_lengths (TensorNone, 可选) – 批次中每个有效音频的有效长度张量。形状:(batch, ) (默认:None)

返回

张量

掩码序列,是形状为 (batch, frame dim) 的概率分布。

Tensor 或 None

如果提供了 lengths 参数,则返回形状为 (batch, ) 的张量,表示时间轴上的有效长度。

张量

掩码索引。

张量

目标,在负采样之前。

张量

负样本。

张量

负样本的索引。

返回类型

(Tensor, Optional[Tensor], Tensor, Tensor, Tensor, Tensor)

工厂函数

conformer_wav2vec2_pretrain_model

已弃用

conformer_wav2vec2_pretrain_base

已弃用

conformer_wav2vec2_pretrain_large

已弃用

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源