SquimSubjective¶
- class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[源代码]¶
语音质量和可懂度度量 (SQUIM) 模型,用于预测语音增强的主观度量分数 (例如,主观平均分 MOS)。该模型改编自 NORESQA-MOS [Manocha and Kumar, 2022],该模型根据输入语音和非匹配参考来预测 MOS 分数。
- 参数
ssl_model (torch.nn.Module) – 用于特征提取的自监督学习模型。
projector (torch.nn.Module) – 将 SSL 特征投影到较低维度的投影层。
predictor (torch.nn.Module) – 预测主观分数。
- 使用
SquimSubjective
的教程
方法¶
forward¶
- SquimSubjective.forward(waveform: Tensor, reference: Tensor)[源代码]¶
预测主观评估度量分数。
- 参数
waveform (torch.Tensor) – 用于评估的输入波形。维度为 (batch, time) 的张量。
reference (torch.Tensor) – 非匹配的干净参考。维度为 (batch, time_ref) 的张量。
- 返回
主观度量分数。维度为 (batch,) 的张量。
- 返回类型
工厂函数¶
构建自定义的 |
|
使用默认参数构建 |