快捷方式

PSD

class torchaudio.transforms.PSD(multi_mask: bool = False, normalize: bool = True, eps: float = 1e-15)[源代码]

计算跨通道功率谱密度 (PSD) 矩阵。

This feature supports the following devices: CPU, CUDA This API supports the following properties: Autograd, TorchScript
参数
  • multi_mask (bool, optional) – 如果 True,则只接受多通道时频掩码。(默认: False)

  • normalize (bool, optional) – 如果 True,则沿时间维度归一化掩码。(默认: True)

  • eps (float, optional) – 在掩码归一化中加到分母上的值。(默认: 1e-15)

使用 PSD 的教程
Speech Enhancement with MVDR Beamforming

使用 MVDR 波束成形进行语音增强

使用 MVDR 波束成形进行语音增强
forward(specgram: Tensor, mask: Optional[Tensor] = None)[源代码]
参数
  • specgram (torch.Tensor) – 多通道复数值谱。张量维度为 (..., channel, freq, time)

  • mask (torch.TensorNone, optional) – 用于归一化的时频掩码。如果 multi_mask 为 False,则张量维度为 (..., freq, time);如果 multi_mask 为 True,则张量维度为 (..., channel, freq, time)。(默认: None)

返回

输入谱的复数值 PSD 矩阵。

张量维度为 (..., freq, channel, channel)

返回类型

torch.Tensor

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源