语音合成(TTS) GPT-SoVITS认知
不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。——村上春树
写在前面
- 小伙伴推荐,简单了解
- 相对之前试过的其他的TTS项目,
GPT-SoVITS
的优点 - 简单易用,文档完整,默认的模型效果就很好
- 理解不足小伙伴帮忙指正
不必太纠结于当下,也不必太忧虑未来,当你经历过一些事情的时候,眼前的风景已经和从前不一样了。——村上春树
GPT-SoVITS实现了:
- 由参考音频的情感、音色、语速控制合成音频的情感、音色、语速
- 可以少量语音微调训练,也可不训练直接推理
- 可以跨语种生成,即参考音频(训练集)和推理文本的语种为不同语种
项目地址:
https://github.com/RVC-Boss/GPT-SoVITS/blob/main/README.md
第一次玩直接下载整合包就好:
直接执行 bat
脚本就可以
1 | D:\GPT-SoVITS-beta\GPT-SoVITS-beta0217>runtime\python.exe webui.py |
这里我们选中 是否开启TTS推理WebUI
稍等一会
会自动在浏览器打开推理页面
整合包默认会有模型,可以直接使用
参考音频准备
找一段游戏配音原声
如果不是原声,可以使用自带的工具处理,或者用Au
剪一下,或者使用 整理包里的 ffmpeg
工具直接处理
参考音频:
年轻游侠儿泪眼模糊,凄然一笑,站起身,拿木剑对准墙壁,狠狠折断。此后江湖再无温华的消息,这名才出江湖便已名动天下的木剑游侠儿,一夜之间,以最决然的苍凉姿态,离开了江湖。刺骨大雪中,他最后对自己说了一句。“不练剑了。”
推理结果
参考音频:
姜泥声若细蚊道:“是不是我走了,就杀不了你了?”,徐凤年转身笑道:“当然不会,有曹官子和老剑神两位高人教你,说不定过个几年就能杀我了,走吧走吧,省得天天在本世子面前晃荡,没你在,记得杀我之前通知一声,我也好睡安稳觉,我能睡几年是几年,”,姜泥咬着嘴唇道:“那我就不走!。
推理结果
博文部分内容参考
© 文中涉及参考链接内容版权归原作者所有,如有侵权请告知 :)
https://github.com/RVC-Boss/GPT-SoVITS/blob/main/README.md
© 2018-至今 liruilonger@gmail.com, All rights reserved. 保持署名-非商用-相同方式共享(CC BY-NC-SA 4.0)
语音合成(TTS) GPT-SoVITS认知
https://liruilongs.github.io/2024/02/25/AI-人脸识别/语音合成GPT-SoVITS认知/