如何通过自己训练的单人speaker的fastspeech2模型进行二次微调，并且加入到模型中，且可以通过id索引的方式进行推理不同音色 #2953

CnYiXiaoNaiHe · 2023-02-23T14:01:07Z

一共两个问题。
1.在单音色原有的基础上进行调整训练形成另一个音色。
2.如何讲上面二次训练的音色配置到模型中，并且推理阶段可以通过索引来控制使用哪种音色合成

yt605155624 · 2023-02-24T02:12:26Z

CnYiXiaoNaiHe · 2023-02-28T07:37:53Z

第一种方法也就是说如果想通过一个模型的不同ID来索引多音色的话，需要遵守AISHELL3的多说话人语音进行设置训练；
第二种方法就是训练多个单音色模型进行控制，这样的话相当于有多个模型，相当于单模型的N倍。
可以这么理解嘛

yt605155624 · 2023-02-28T09:29:10Z

可以

CnYiXiaoNaiHe · 2023-03-01T02:35:11Z

关于训练语料每种音色至少准备多少，这个有统计数据吗

yt605155624 self-assigned this Feb 24, 2023

yt605155624 added T2S Question labels Feb 24, 2023

yt605155624 mentioned this issue Mar 1, 2023

💡 TTS 小样本 finetune / 声音克隆问题汇总 #2456

Open

yt605155624 closed this as completed Mar 21, 2023

Provide feedback