DeepSpeech¶ class torchaudio.models.DeepSpeech(n_feature: int, n_hidden: int = 2048, n_class: int = 40, dropout: float = 0.0)[源代码]¶ DeepSpeech 架构,源自论文 Deep Speech: Scaling up end-to-end speech recognition [Hannun et al., 2014]。 参数 n_feature – 输入特征的数量 n_hidden – 内部隐藏单元的大小。 n_class – 输出类的数量 方法¶ forward¶ DeepSpeech.forward(x: Tensor) → Tensor[源代码]¶ 参数 x (torch.Tensor) – 维度为 (batch, channel, time, feature) 的张量。 返回 预测器张量,维度为 (batch, time, class)。 返回类型 张量