-
Notifications
You must be signed in to change notification settings - Fork 3.5k
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
使用vllm后的音色疑似只有男声 #640
Comments
vllm还在适配各种功能阶段,现在还没有支持spk_emb。 |
嗯,的确有这个问题! |
看代码好像是 基础版传进了emb这个变量, 而 vllm 没有, 所以是不是只需要在 vllm infer 的时候 想办法传入 emb 就好了 |
应该不是。无 vLLM 的代码在 spk 为空时也会随机出现男女。 |
原因确实是emb模块没加音色emb。原生的随机出现男女,1是他随机了音色embedding,2是模型本身具有一定随机性。 这个模块我个人私仓已经实现了,因为直接在ChatTTS-Forge那个仓库改的,等找个时间提pr过来到这 |
感谢,vLLM 代码我还没来得及细看。 |
你好,请问这个方便请教一下吗? 我们最近也有在做这方面的优化,想学习学习 |
大佬,我也很想学习一下 |
我在is_vllm判断这里添加上了spk_emb(spk_emb=params.spk_emb),但是生成出来的还是一个声音,请教大佬如何修改
|
不在这改,在model_runner里面改。 我这边改动太大,功能包括
方案跟当前仓库方案差异比较大,pr不准备提了,后面准备重新开个新仓库。 |
vllm相关修改尽管提就行,在velocity那个文件夹内部怎么改都没有问题,只要外面调用不变。 |
#755 |
确实要改挺多的,需要一路传参到model_runner中,我是直接将声音种子放到了model_runner中做了实验。 |
dev分支用相同spk_emb,vllm版音色跟原版不一样。而且vllm版似乎只能抽卡到男声音色
The text was updated successfully, but these errors were encountered: