torchaudio.functional.inverse_spectrogram¶
- torchaudio.functional.inverse_spectrogram(spectrogram: Tensor, length: Optional[int], pad: int, window: Tensor, n_fft: int, hop_length: int, win_length: int, normalized: Union[bool, str], center: bool = True, pad_mode: str = 'reflect', onesided: bool = True) Tensor [源代码]¶
从提供的复值频谱图创建逆频谱图或一批逆频谱图。
- 参数
spectrogram (Tensor) – 音频的复数张量,维度为 (..., freq, time)。
length (int 或 None) – 波形的输出长度。
pad (int) – 信号的双边填充。仅当提供了
length
时有效。window (Tensor) – 应用/乘以每个帧/窗口的窗口张量
n_fft (int) – FFT 的大小。
hop_length (int) – STFT 窗口之间的跳跃长度。
win_length (int) – 窗口大小。
normalized (bool 或 str) – STFT 输出是否按幅度进行了归一化。如果输入是字符串,则选项为
"window"
和"frame_length"
,具体取决于归一化模式。True
映射到"window"
。center (bool, 可选) – 波形是否在两侧进行了填充,使得 \(t\)-th 帧位于时间 \(t \times \text{hop\_length}\) 处。默认为
True
。pad_mode (string, 可选) – 当
center
为True
时,控制使用的填充方法。此参数为兼容频谱图函数而提供,但未使用。默认为"reflect"
。onesided (bool, 可选) – 控制频谱图是否以单边模式生成。默认为
True
。
- 返回
维度 (..., time)。原始信号的最小二乘估计。
- 返回类型
张量