快捷方式

Wav2Letter

class torchaudio.models.Wav2Letter(num_classes: int = 40, input_type: str = 'waveform', num_features: int = 1)[源代码]

Wav2Letter 模型架构,出自Wav2Letter: an End-to-End ConvNet-based Speech Recognition System [Collobert et al., 2016]

另请参阅

参数
  • num_classes (int, optional) – 要分类的类别数量。 (默认: 40)

  • input_type (str, optional) – Wav2Letter 可以使用的输入类型: waveformpower_spectrummfcc (默认: waveform)。

  • num_features (int, optional) – 网络将接收的输入特征数量 (默认: 1)。

方法

forward

Wav2Letter.forward(x: Tensor) Tensor[源代码]
参数

x (torch.Tensor) – 维度为 (batch_size, num_features, input_length) 的张量。

返回

维度为 (batch_size, number_of_classes, input_length) 的预测器张量。

返回类型

张量

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源