torchaudio.functional.melscale_fbanks¶
- torchaudio.functional.melscale_fbanks(n_freqs: int, f_min: float, f_max: float, n_mels: int, sample_rate: int, norm: Optional[str] = None, mel_scale: str = 'htk') Tensor [源代码]¶
创建频率bin转换矩阵。
注意
为了与 librosa 的数值兼容性,并非所有滤波器组中的系数都具有 1 的幅度。
- 参数
- 返回
三角滤波器组(fb 矩阵),大小为(
n_freqs
,n_mels
),表示需要强调/应用的频率数量乘以滤波器组的数量。每一列都是一个滤波器组,因此假设有一个大小为(…,n_freqs
)的矩阵 A,则应用结果为A @ melscale_fbanks(A.size(-1), ...)
。- 返回类型
张量
- 使用
melscale_fbanks
的教程