快捷方式

torchaudio.functional.inverse_spectrogram

torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) Tensor[源代码]

从提供的复值频谱创建逆频谱或频谱批次。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数
  • spectrogram (Tensor) – 音频的复张量,维度为 (..., freq, time)。

  • length (intNone) – 波形的输出长度。

  • pad (int) – 信号的双边填充。仅当提供 length 时有效。

  • window (Tensor) – 应用/乘以每个帧/窗口的窗口张量

  • n_fft (int) – FFT 大小

  • hop_length (int) – STFT 窗口之间的跳跃长度

  • win_length (int) – 窗口大小

  • normalized (boolstr) – stft 输出是否已按幅度归一化。如果输入是 str,选项为 "window""frame_length",取决于归一化模式。 True 映射到 "window"

  • center (bool, 可选) – 波形是否在两侧进行了填充,以便 \(t\)-th 帧位于时间 \(t \times \text{hop\_length}\) 处。默认为:True

  • pad_mode (string, 可选) – 当 centerTrue 时,控制使用的填充方法。此参数用于与 spectrogram 函数兼容,但未使用。默认为:"reflect"

  • onesided (bool, 可选) – 控制频谱是否以单边模式进行。默认为:True

返回

维度 (..., time)。原始信号的最小二乘估计。

返回类型

张量

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源