VITS2 Backbone with bert
【【Bert-Vits2】带标注功能的整合包!轻松训练属于你的“神之嘴”!-哔哩哔哩】 https://b23.tv/Ir2OG5d
本仓库的代码是为了给自己部署不成功的,代码报错的人一些参考,或者是用于快速更新整合包。云端训练请自己结合原项目把相关文件和目录补齐。
1.自动标注提示没有短音频:如果确定数据集存放位置正确,安装ffmpeg即可,已经有人自己解决了这个问题。我自己2遍调试下来ffmpeg的安装在我自己的电脑上是没有问题的(从环境变量里删除就会报错!安装后恢复正常!) 但是要注意安装完可能要重启电脑,另外要检查环境变量里的ffmpeg是不是从其他来源安装了,版本不对有可能产生错误。如果按照说明安装后仍未解决问题,尝试手动安装(教程自己搜)--补充:现在又来了个路径有中文导致该错误的例子(?) 以及,手动安装可以尝试把它加入系统的Path
2.ZeroDivisionError: integer division or modulo by zero 零除错误:关键代码和9.3原项目同步更新,新整合包已经解决了此问题。
3.whisper下载问题:把whisper_model文件夹下的文件复制到 C:\Users\<电脑的用户名>\.cache\whisper 里面即可
4.如果不使用自带的标注,自行重采样数据集至44100Hz单声道。
前往另一个分支。
请注意,本项目核心思路来源于anyvoiceai/MassTTS 一个非常好的tts项目
MassTTS的演示demo为ai版峰哥锐评峰哥本人,并找回了在金三角失落的腰子
本项目与PlayVoice/vits_chinese 没有任何关系
本仓库来源于之前朋友分享了ai峰哥的视频,本人被其中的效果惊艳,在自己尝试MassTTS以后发现fs在音质方面与vits有一定差距,并且training的pipeline比vits更复杂,因此按照其思路将bert 与vits结合起来以获得更好的韵律。本身我们是出于兴趣玩开源项目,用爱发电,我们本无意与任何人起冲突,然而MaxMax2016 以及其organizationPlayVoice几次三番前来碰瓷,说本项目抄袭了他们的代码,甚至上法院云云,因此在Readme中特别声明,本项目与 PlayVoice/vits_chinese没有任何关系,结合bert的思路方面也是完全来源于MassTTS
附:对面认为本项目抄袭了他代码的证据,诸位可以自行查看并做出判断,bert_vits2引用的MassTTS的实际代码
- anyvoiceai/MassTTS
- jaywalnut310/vits
- p0p4k/vits2_pytorch
- svc-develop-team/so-vits-svc
- PaddlePaddle/PaddleSpeech
- emotional-vits