WAVLM_BASE_PLUS¶
- torchaudio.pipelines.WAVLM_BASE_PLUS¶
WavLM Base+ 模型(“base”架构),在 60,000 小时 Libri-Light 数据集 [Kahn et al., 2020]、10,000 小时 GigaSpeech [Chen et al., 2021] 和 24,000 小时 *VoxPopuli* [Wang et al., 2021] 上进行了预训练,未进行微调。
最初由 *WavLM* 的作者 [Chen et al., 2022] 在 MIT 许可下发布,并以相同的许可重新分发。[许可, 来源]
请参考
torchaudio.pipelines.Wav2Vec2Bundle
的用法。