TACOTRON2_GRIFFINLIM_PHONE_LJSPEECH¶
- torchaudio.pipelines.TACOTRON2_GRIFFINLIM_PHONE_LJSPEECH¶
基于音素的 TTS 流水线,使用在LJSpeech上训练了1500个epoch的
Tacotron2
以及GriffinLim
作为声码器。[Ito and Johnson, 2017]文本处理器根据音素对输入文本进行编码。它使用DeepPhonemizer将字形转换为音素。模型(en_us_cmudict_forward)在CMUDict上进行了训练。
您可以在这里找到训练脚本。文本处理器设置为“english_phonemes”。
有关用法,请参考
torchaudio.pipelines.Tacotron2TTSBundle()
。示例 - “Hello world! T T S stands for Text to Speech!”
示例 - “The examination and testimony of the experts enabled the Commission to conclude that five shots may have been fired,”