MockingBird- 文字转语音神器!附最新安装使用教程!

1.安装Python 选择3.8 或更高版本 【官方链接

2.安装 PyTorch, 直接官网下载 【官方链接】,如果GPU不支持CUDA,请默认选择,没有显卡就选择CPU。

3.安装 ffmpeg 【下载链接】,下载后把bin目录路径path到系统变量里,见视频教程。

4.下载 MockingBird 【开源项目】下载解压后,直接在目录输入CMD 进入终端

5.在终端下安装剩余的必备环境包:

python -m pip install --upgrade pip
pip install -r requirements.txt
pip install webrtcvad-wheels

6.下载语言模型,或使用自己训练好的模型

作者 下载链接 效果预览 信息
作者 https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 百度盘链接 4j5d 75k steps 用3个开源数据集混合训练
作者 https://pan.baidu.com/s/1fMh9IlgKJlL2PIiRTYDUvw 百度盘链接 提取码:om7f 25k steps 用3个开源数据集混合训练, 切换到tag v0.0.1使用
@FawenYo https://drive.google.com/file/d/1H-YGOUHpmqKxJ9FRc6vAjPuqQki24UbC/view?usp=sharing 百度盘链接 提取码:1024 input output 200k steps 台湾口音需切换到tag v0.0.1使用
@miven https://pan.baidu.com/s/1PI-hM3sn5wbeChRryX-RCQ 提取码:2021 150k steps 注意:根据issue修复 并切换到tag v0.0.1使用

 

7.下载模型后,确保 xxx.pt 格式的文件放在 synthesizer\saved_models文件夹下,saved_models 如不存在请新建

8.最后执行运行命令,就可以启动程序了!

启动Web程序(v2)

 

python web.py

运行成功后在浏览器打开地址, 默认为 http://localhost:8080

训练数据集下载【点击

GUI启动命令:

 

启动工具箱:

python demo_toolbox.py -vc -d <datasets_root>

假如数据集路径为 C:\data\aidatatang_200zh,那么 <datasets_root>就是 C:\data

程序界面功能说明: