快捷方式

TACOTRON2_WAVERNN_CHAR_LJSPEECH

torchaudio.pipelines.TACOTRON2_WAVERNN_CHAR_LJSPEECH

基于字符的 TTS 流水线,使用在 LJSpeech 上训练了 1,500 个 epoch 的 Tacotron2 [Ito and Johnson, 2017],以及在 LJSpeech 的 8 位深度波形上训练了 10,000 个 epoch 的 WaveRNN 声码器 [Ito and Johnson, 2017]

文本处理器将输入文本按字符进行编码。

您可以在 这里 找到训练脚本。使用的参数如下; win_length=1100, hop_length=275, n_fft=2048, mel_fmin=40, 和 mel_fmax=11025

您可以在 这里 找到训练脚本。

有关用法,请参考 torchaudio.pipelines.Tacotron2TTSBundle()

示例 - “Hello world! T T S stands for Text to Speech!”

Spectrogram generated by Tacotron2

示例 - “The examination and testimony of the experts enabled the Commission to conclude that five shots may have been fired,”

Spectrogram generated by Tacotron2

文档

访问全面的 PyTorch 开发者文档

查看文档

教程

为初学者和高级开发者提供深入的教程

查看教程

资源

查找开发资源并让您的问题得到解答

查看资源