-
在finetune的时候需要先生成预测的mel,但是好像目前只支持baker的单人数据集,如果需要支持多人是不是需要加入参数--speaker-dict,在这行代码中加入spk_num。 PaddleSpeech/paddlespeech/t2s/exps/fastspeech2/gen_gta_mel.py Lines 45 to 46 in 36c9eaa 在这行代码中加入spk_id 其他还有什么需要修改的吗?另外问一下为什么fastspeech2_inference中的参数不需要传入pitch和energy,是用默认的1吗? |
Beta Was this translation helpful? Give feedback.
Replies: 9 comments 9 replies
-
应该没有其他需要修改的地方了 |
Beta Was this translation helpful? Give feedback.
-
排序结果应该是固定的,可以实验一下 |
Beta Was this translation helpful? Give feedback.
-
在preprocess中保存train/dev/test_wav_file到文件,每行是 “文件名 train/dev/test”,然后在gen_gta_mel中读duration.txt每行的时候再去根据文件名去查表以获得文件是train/dev/test,然后再分别保存到对应的路径,这样做您觉得怎么样? |
Beta Was this translation helpful? Give feedback.
-
也可以不在preprocess的时候保存,而在gen gta mel 的时候再读一遍原始数据集再排序,按照 preprocess的过程再划分一下,这样就不用再跑一遍 preprocess了,但是这样实现就要求原始数据的参与了… |
Beta Was this translation helpful? Give feedback.
-
提交了pr #1278 |
Beta Was this translation helpful? Give feedback.
-
fastspeech2的finetune结果虽然减少了一点金属音,但是感觉整体的音频质量不如finetune之前的,说话有点不流畅,我上传了一些对比的样本,请问有什么解决的方法呢? |
Beta Was this translation helpful? Give feedback.
-
声学模型如果是 speedyspeech 的话,应用 speedyspeech finetune 吧 |
Beta Was this translation helpful? Give feedback.
-
fintune 时用的声学模型应该和合成时用的一致,因为 speedyspeech 和 fastspeech2 合成的 mel 的分布可能不同 |
Beta Was this translation helpful? Give feedback.
-
今天用的时候发现这行报错了,找不到link_wav.py。是不是不能这么写,export PATH好像找不到py文件,只能找到可执行文件,需要改为这样吗? python3 ${MAIN_ROOT}/utils/link_wav.py \ |
Beta Was this translation helpful? Give feedback.
提交了pr #1278