torchaudio.functional¶
执行常见音频操作的函数。
实用程序¶
将频谱图从功率/幅度尺度转换为分贝尺度。 |
|
将张量从分贝尺度转换为功率/幅度尺度。 |
|
创建频率bin转换矩阵。 |
|
创建线性三角滤波器组。 |
|
创建具有形状( |
|
沿 |
|
沿 |
|
基于 mu-law 压扩对信号进行编码。 |
|
解码 mu-law 编码信号。 |
|
使用带限插值以新频率重采样波形。 |
|
根据 ITU-R BS.1770-4 建议测量音频响度。 |
|
使用直接方法沿最后一个维度卷积输入。 |
|
使用 FFT 沿最后一个维度卷积输入。 |
|
根据信噪比缩放波形并添加噪声。 |
|
沿最后一个维度对波形进行预加重,即对于 |
|
沿最后一个维度对波形进行去加重。 |
|
调整波形速度。 |
|
计算两个多元正态分布之间的 Fréchet 距离 [Dowson and Landau, 1982]。 |
强制对齐¶
已弃用 |
|
从给定的 CTC token 序列中移除重复的 token 和空白 token。 |
|
带时间戳和分数的 token。 |
滤波¶
设计二阶全通滤波器。 |
|
设计二阶带通滤波器。 |
|
设计二阶带通滤波器。 |
|
设计二阶带阻滤波器。 |
|
设计低音控制效果。 |
|
对输入张量执行双二阶滤波。 |
|
应用对比度效果。 |
|
对音频应用直流偏移。 |
|
应用 ISO 908 CD 去加重(搁架式)IIR 滤波器。 |
|
应用抖动 |
|
设计双二阶峰化均衡滤波器并进行滤波。 |
|
将 IIR 滤波器正向和反向应用于波形。 |
|
对音频应用镶边效果。 |
|
对整个波形应用放大或衰减。 |
|
设计双二阶高通滤波器并进行滤波。 |
|
通过评估差分方程执行 IIR 滤波,使用 Yu et al. [Yu and Fazekas, 2023] 和 Forgione et al. [Forgione and Piga, 2021] 分别开发的微分实现。 |
|
设计双二阶低通滤波器并进行滤波。 |
|
对音频应用过载效果。 |
|
对音频应用移相效果。 |
|
应用 RIAA 黑胶唱片播放均衡。 |
|
设计高音控制效果。 |
特征提取¶
语音活动检测器。 |
|
从原始音频信号创建频谱图或频谱图批。 |
|
从提供的复值频谱图创建逆频谱图或逆频谱图批。 |
|
使用 Griffin-Lim 变换从线性幅度频谱图计算波形。 |
|
给定 STFT 张量,在不改变音高的情况下,将时间速度提高 |
|
将波形的音高移动 |
|
计算张量的 delta 系数,通常是频谱图。 |
|
检测音高频率。 |
|
按话语应用滑动窗口倒谱均值(和可选方差)归一化。 |
|
沿时间轴计算每个通道的谱质心。 |
多通道¶
计算跨通道功率谱密度 (PSD) 矩阵。 |
|
根据 Souden et, al. 提出的方法计算最小方差无失真响应 (MVDR [Capon, 1969]) 波束形成权重 [Souden et al., 2009]。 |
|
基于相对传递函数 (RTF) 和噪声功率谱密度 (PSD) 矩阵计算最小方差无失真响应 (MVDR [Capon, 1969]) 波束形成权重。 |
|
通过特征值分解估计相对传递函数 (RTF) 或导向矢量。 |
|
通过幂法估计相对传递函数 (RTF) 或导向矢量。 |
|
将波束形成权重应用于多通道噪声频谱,以获得单通道增强频谱。 |
损失¶
已弃用 |
指标¶
计算两个序列之间的词级别编辑(Levenshtein)距离。 |