TimeStretch¶
- class torchaudio.transforms.TimeStretch(hop_length: Optional[int] = None, n_freq: int = 201, fixed_rate: Optional[float] = None)[源代码]¶
以给定的速率在时间上拉伸 STFT,而不改变音高。
提出于 _SpecAugment_ [Park _et al._, 2019]。
- 参数
注意
期望的输入是原始的、复数值的频谱图。
- 示例
>>> spectrogram = torchaudio.transforms.Spectrogram(power=None) >>> stretch = torchaudio.transforms.TimeStretch() >>> >>> original = spectrogram(waveform) >>> stretched_1_2 = stretch(original, 1.2) >>> stretched_0_9 = stretch(original, 0.9)
- 使用
TimeStretch
的教程
- forward(complex_specgrams: Tensor, overriding_rate: Optional[float] = None) Tensor [源代码]¶
- 参数
complex_specgrams (Tensor) – 维度为 (..., freq, num_frame) 的复数类型张量。
overriding_rate (float 或 None, 可选) – 要应用于此批次的加速速率。如果未传入速率,则使用
self.fixed_rate
。(默认:None
)
- 返回
拉伸后的频谱图。结果张量的复杂类型与输入频谱图相同,帧数变为
ceil(num_frame / rate)
。- 返回类型
张量