WAVLM_BASE_PLUS¶
- torchaudio.pipelines.WAVLM_BASE_PLUS¶
WavLM Base+ 模型(“base”架构),在 60,000 小时的 Libri-Light 数据集 [Kahn et al., 2020]、10,000 小时的 GigaSpeech [Chen et al., 2021] 和 24,000 小时的 VoxPopuli [Wang et al., 2021] 上预训练,但未进行微调。
最初由 WavLM 的作者 [Chen et al., 2022] 在 MIT 许可下发布,并以相同的许可重新分发。[许可, 来源]
有关用法,请参阅
torchaudio.pipelines.Wav2Vec2Bundle
。