快捷方式

DeepSpeech

class torchaudio.models.DeepSpeech(n_feature: int, n_hidden: int = 2048, n_class: int = 40, dropout: float = 0.0)[源代码]

DeepSpeech 架构,源自论文 Deep Speech: Scaling up end-to-end speech recognition [Hannun et al., 2014]

参数
  • n_feature – 输入特征的数量

  • n_hidden – 内部隐藏单元的大小。

  • n_class – 输出类的数量

方法

forward

DeepSpeech.forward(x: Tensor) Tensor[源代码]
参数

x (torch.Tensor) – 维度为 (batch, channel, time, feature) 的张量。

返回

预测器张量,维度为 (batch, time, class)。

返回类型

张量

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源