SquimSubjective¶
- class torchaudio.models.SquimSubjective(ssl_model: Module, projector: Module, predictor: Module)[source]¶
Speech Quality and Intelligibility Measures (SQUIM) 模型,用于预测语音增强的主观评价分数(例如,平均意见分数 (MOS))。该模型改编自 NORESQA-MOS [Manocha and Kumar, 2022],它根据输入语音和非匹配参考来预测 MOS 分数。
- 参数
ssl_model (torch.nn.Module) – 用于特征提取的自监督学习模型。
projector (torch.nn.Module) – 将 SSL 特征投影到较低维度的投影层。
predictor (torch.nn.Module) – 预测主观分数。
- 使用
SquimSubjective
的教程
方法¶
forward¶
- SquimSubjective.forward(waveform: Tensor, reference: Tensor)[source]¶
预测主观评价指标分数。
- 参数
waveform (torch.Tensor) – 用于评估的输入波形。维度为 (batch, time) 的张量。
reference (torch.Tensor) – 非匹配的干净参考。维度为 (batch, time_ref) 的张量。
- 返回
主观评价指标分数。维度为 (batch,) 的张量。
- 返回类型
工厂函数¶
构建自定义的 |
|
使用默认参数构建 |