简体中文 | English
一个基于开源语音项目实现的简易语音工具箱,提供了包括语音模型训练在内的多种自动化音频工具
工具箱目前包含以下功能:
这些功能依次关联,能够形成一套完整的工作流
用户可以根据自己的需求有选择性地使用,亦或者依次通过这些工具将未经处理的语音文件逐步变为理想的语音模型
由衷感谢以下项目的作者,这个工具箱的实现正是得益于他们的优秀成果
目前发布的版本仅支持Windows系统
目前各个工具对语言的支持情况如下:
工具 | 中文 | 英文 | 日文 |
---|---|---|---|
音频处理 | ✔ | ✔ | ✔ |
语音识别 | ✔ | ✔ | ✔ |
语音转录 | ✔ | ✔ | ✔ |
数据集制作 | ✔ | ✔ | ✔ |
模型训练 | ✔ | ✔ | ✔ |
语音合成 | ✔ | ✔ | ✔ |
您有两种选择:
点击Main.exe文件或其快捷方式即可
- 请确保您已安装了
版本≥3.8
的Python
-
克隆项目仓库
git clone --recurse-submodules https://github.com/Spr-Aachen/Easy-Voice-Toolkit.git
-
切至项目目录
%cd Easy-Voice-Toolkit
-
安装pytorch(可从官网复制命令)
# e.g. (注意自己的cuda版本,这里以11.8为例) pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118
-
安装项目依赖
pip install -r requirements.txt
-
安装GUI依赖
pip install QEasyWidgets
- 启动客户端
run.py
点击以使用上面的demo,或者在Colab中上传run.ipynb
- 添加LLM联动功能
- 使用C++重构前端
- 后端开发
- 语言国际化
- 兼容Linux系统
- Type: Laptop
- GPU: GTX 1660Ti
- CPU: i5-10300H
- RAM: 16G
- OS: Win10
- Python: 3.9
- Torch: 2.0.1
-
Q: 更新客户端/下载依赖/模型时总是提示失败/报错该怎么办?
A: 开代理或者直接用懒人包 -
Q: 好多参数都不清楚要如何设置该怎么办?
A: 不明白的话使用默认值就好 -
Q: 你这永久免费开源...它保真吗?
A: 嗯哼~♪
请自行解决数据集的授权问题。对于使用未经授权的数据集进行训练所导致的任何问题,您将承担全部责任,并且该仓库及其维护者不承担任何后果!相关法律请参照《中华人民共和国治安管理处罚法》和《中华人民共和国民法典》
- 本项目仅用于学术交流目的,旨在促进沟通和学习。不适用于生产环境。
- 基于 Easy Voice Toolkit 发布的任何视频必须在描述中明确指出它们用于变声,并指定声音或音频的输入源,例如使用他人发布的视频或音频,并将分离出的人声作为转换的输入源,必须提供清晰的原始视频链接。如果您使用自己的声音或其他商业语音合成软件生成的声音作为转换的输入源,也必须在描述中说明。
- 您将对输入源引起的任何侵权问题负全部责任。当使用其他商业语音合成软件作为输入源时,请确保遵守该软件的使用条款。请注意,许多语音合成引擎在其使用条款中明确声明不能用于输入源转换。
- 继续使用本项目被视为同意本仓库 README 中所述的相关条款。本仓库的 README 有义务进行劝导,但不承担可能出现的任何后续问题的责任。
- 如果您分发此仓库的代码或将由此项目生成的任何结果公开发布(包括但不限于视频分享平台),请注明原始作者和代码来源(即此仓库)。
- 如果您将此项目用于任何其他计划,请提前与本仓库的作者联系并告知
Reference: so-vits-svc