WAVLM_BASE¶
- torchaudio.pipelines.WAVLM_BASE¶
WavLM Base 模型(“base”架构),在 *LibriSpeech* 数据集上使用 960 小时的无标签音频进行了预训练 [Panayotov et al., 2015],未进行微调。
最初由 *WavLM* 的作者在 MIT 许可证下发布 [Chen et al., 2022],并以相同的许可证重新分发。[许可证, 源码]
有关用法,请参阅
torchaudio.pipelines.Wav2Vec2Bundle
。