torchaudio.functional.rtf_power¶

torchaudio.functional.rtf_power(psd_s: Tensor, psd_n: Tensor, reference_channel: Union[int, Tensor], n_iter: int = 3, diagonal_loading: bool = True, diag_eps: float = 1e-07) → Tensor[源代码]¶

通过幂法估计相对传输函数 (RTF) 或导向矢量。

参数

psd_s (torch.Tensor) – 目标语音的复值功率谱密度 (PSD) 矩阵。维度为 (…, freq, channel, channel) 的张量。
psd_n (torch.Tensor) – 噪声的复值功率谱密度 (PSD) 矩阵。形状为 (..., freq, channel, channel) 的张量。
reference_channel (int 或 torch.Tensor) – 指定参考通道。如果 dtype 为 int，则表示参考通道索引。如果 dtype 为 torch.Tensor，则其形状为 (..., channel)，其中 channel 维度是独热编码的。
diagonal_loading (bool, 可选) – 如果为 True，则启用对 psd_n 应用对角加载。 (默认: True)
diag_eps (float, 可选) – 用于对角加载的单位矩阵的乘数。仅当 diagonal_loading 设置为 True 时有效。 (默认: 1e-7)

返回

估计的复值目标语音 RTF。维度为 (…, freq, channel) 的张量。

返回类型

torch.Tensor

文档