目录

快捷方式

PSD¶

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[源代码]¶

计算跨通道功率谱密度 (PSD) 矩阵。

参数

multi_mask (bool, optional) – 如果 True，则仅接受多通道时频掩码。 (默认： False)
normalize (bool, optional) – 如果 True，则沿时间维度归一化掩码。 (默认： True)
eps (float, optional) – 在掩码归一化中加到分母的值。 (默认： 1e-15)

使用 PSD 的教程: 使用 MVDR 波束成形进行语音增强

使用 MVDR 波束成形进行语音增强

forward(specgram: Tensor, mask: Optional[Tensor] = None)[源代码]¶

参数

specgram (torch.Tensor) – 多通道复值频谱。维度为 (…, channel, freq, time) 的张量。
mask (torch.Tensor 或 None, optional) – 用于归一化的时频掩码。如果 multi_mask 为 False，则张量维度为 (..., freq, time)；如果 multi_mask 为 True，则维度为 (..., channel, freq, time)。 (默认： None)

返回

输入频谱的复值 PSD 矩阵。: 维度为 (..., freq, channel, channel) 的张量

返回类型

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源