更好用户体验,建议参考WEB端官方文档 -> 【语音合成】
语音合成(TTS)任务可以实现讲文字转化为语音,已经广泛应用于各种语音交互设备中。
- 推荐模型
模型名称 | 模型简介 |
---|---|
语音合成transformer_tts_ljspeech | TansformerTTS 对 Transformer 和 Tacotron2 进行了融合,取得了令人满意的效果,英文TTS模型,仅支持预测。 |
语音合成fastspeech_ljspeech | FastSpeech是基于encoder-decoder结构的teacher model中提取attention对角线来做发音持续时间预测,英文TTS模型,仅支持预测。 |
语音合成deepvoice3_ljspeech | Deep Voice 3是百度研究院2017年发布的端到端的TTS模型(论文录用于ICLR 2018)。它是一个基于卷积神经网络和注意力机制的seq2seq模型,英文TTS模型,仅支持预测。 |