TacoTron2 多人模型会有吗 #1434
-
如题,大概啥时候会有呢? |
Beta Was this translation helpful? Give feedback.
Answered by
yt605155624
Feb 17, 2022
Replies: 3 comments
-
aishell3更新了一版 vc0 的代码, tts0 暂时不打算弄了,可以自己做一下 |
Beta Was this translation helpful? Give feedback.
0 replies
-
Beta Was this translation helpful? Give feedback.
0 replies
-
Beta Was this translation helpful? Give feedback.
0 replies
Answer selected by
yt605155624
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
我训练 tacotron2 aishell3 vc0(也是多说话人,不过 speak emb 是通过声纹模型合成的) 的时候训练到后期很不稳定(train 和 eval 都是,注意 8e+4 的峰值),正常的 loss 应该在 0.58 左右
如果我不幸使用了 loss 曲线在上升的时候保存的模型用于合成,合成的结果就是乱七八糟,听不出正确的文字,应该是 attn 的问题,现在放出来的模型只训练了 100 epoch 不到(而且还是精心挑选的模型,我训练的时候 snapshot 调成了 50, 害怕中途 loss 低的模型被覆盖掉), 因为 200 epoch 很容易不稳定,即使增加到 300 epoch 也还是不太稳定。。
Tacotron2 多说话人貌似挺难调的,推荐还是不要用了 = = 如果您实在想自己训练,建议多保留 snapshot(默认是 5 ,你改成 50),提前停止,精心挑选。。。