快捷方式

PSD

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[源代码]

计算跨通道功率谱密度 (PSD) 矩阵。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数
  • multi_mask (bool, optional) – 如果 True,则仅接受多通道时频掩码。 (默认: False)

  • normalize (bool, optional) – 如果 True,则沿时间维度归一化掩码。 (默认: True)

  • eps (float, optional) – 在掩码归一化中加到分母的值。 (默认: 1e-15)

使用 PSD 的教程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束成形进行语音增强

使用 MVDR 波束成形进行语音增强
forward(specgram: Tensor, mask: Optional[Tensor] = None)[源代码]
参数
  • specgram (torch.Tensor) – 多通道复值频谱。维度为 (…, channel, freq, time) 的张量。

  • mask (torch.TensorNone, optional) – 用于归一化的时频掩码。如果 multi_mask 为 False,则张量维度为 (..., freq, time);如果 multi_mask 为 True,则维度为 (..., channel, freq, time)。 (默认: None)

返回

输入频谱的复值 PSD 矩阵。

维度为 (..., freq, channel, channel) 的张量

返回类型

torch.Tensor

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源