快捷方式

SquimSubjective

class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[源代码]

语音质量和可懂度度量 (SQUIM) 模型,用于预测语音增强的主观度量分数 (例如,主观平均分 MOS)。该模型改编自 NORESQA-MOS [Manocha and Kumar, 2022],该模型根据输入语音和非匹配参考来预测 MOS 分数。

参数
使用 SquimSubjective 的教程
Torchaudio-Squim: Non-intrusive Speech Assessment in TorchAudio

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估

Torchaudio-Squim:TorchAudio 中的非侵入式语音评估

方法

forward

SquimSubjective.forward(waveform: Tensor, reference: Tensor)[源代码]

预测主观评估度量分数。

参数
  • waveform (torch.Tensor) – 用于评估的输入波形。维度为 (batch, time) 的张量。

  • reference (torch.Tensor) – 非匹配的干净参考。维度为 (batch, time_ref) 的张量。

返回

主观度量分数。维度为 (batch,) 的张量。

返回类型

(torch.Tensor)

工厂函数

squim_subjective_model

构建自定义的 torchaudio.prototype.models.SquimSubjective 模型。

squim_subjective_base

使用默认参数构建 torchaudio.prototype.models.SquimSubjective 模型。

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源