Skip to content

TacoTron2 多人模型会有吗 #1434

Answered by yt605155624
jerryuhoo asked this question in Q&A
Discussion options

You must be logged in to vote

我训练 tacotron2 aishell3 vc0(也是多说话人,不过 speak emb 是通过声纹模型合成的) 的时候训练到后期很不稳定(train 和 eval 都是,注意 8e+4 的峰值),正常的 loss 应该在 0.58 左右


如果我不幸使用了 loss 曲线在上升的时候保存的模型用于合成,合成的结果就是乱七八糟,听不出正确的文字,应该是 attn 的问题,现在放出来的模型只训练了 100 epoch 不到(而且还是精心挑选的模型,我训练的时候 snapshot 调成了 50, 害怕中途 loss 低的模型被覆盖掉), 因为 200 epoch 很容易不稳定,即使增加到 300 epoch 也还是不太稳定。。
Tacotron2 多说话人貌似挺难调的,推荐还是不要用了 = = 如果您实在想自己训练,建议多保留 snapshot(默认是 5 ,你改成 50),提前停止,精心挑选。。。

Replies: 3 comments

Comment options

You must be logged in to vote
0 replies
Comment options

You must be logged in to vote
0 replies
Comment options

You must be logged in to vote
0 replies
Answer selected by yt605155624
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Category
Q&A
Labels
2 participants