MMS_FA¶
- torchaudio.pipelines.MMS_FA¶
在《Scaling Speech Technology to 1,000+ Languages》一文中的 1,130 种语言的 31K 小时数据上训练而成 [Pratap et al., 2023]。
由《Scaling Speech Technology to 1,000+ Languages》的作者发布 [Pratap et al., 2023],遵循 [CC-BY-NC 4.0 许可协议]。
有关使用细节,请参阅
torchaudio.pipelines.Wav2Vec2FABundle
。注意
与其他 Wav2Vec2 bundle 不同,此模型没有用于词边界的 token(例如 |)。这使得对齐的后处理略有不同。