说起文生语音模型,最广为人知的肯定是 OpenAI 的 Whisper,之前试过确实很 OK,不过国内要使用比较麻烦而且收费,所以今天要说的是一款开源语音模型——ChatTTS,它在短短两个月的时间就获得了 29k 的 Star。
为什么它如此受欢迎?三金觉得起码有以下三点:
- 开源免费,个人电脑只要配置不是太差都能跑
- 生成的语音真的很逼真,还可以加一些语气词、笑声、停顿
- 提供 WebUI,简化操作
GitHub 地址
而在 ChatTTS 开始发力之后,它的派生项目也接踵而至,其中比较知名的就是三金部署的——ChatTTS-ui,它简化了 ChatTTS 中的 WebUI,让用户只需要关注要转化的文字、音色、语速、语气和笑声等几个常用项,并支持对外提供 API 接口。
接下来我们就从项目部署、使用、及 API 接口逐一介绍~
以 Mac 电脑为例,部署超级简单!前置准备有以下三点:
- 首先,电脑上需要有 python 3.9+ 以上的环境;
- 其次,需要安装 git,因为需要拉项目源码,源码地址
- 最后,需要安装可以处理音频文件的库 libsndfile 以及 ffmpeg
这样环境就搭建好了。
接下来创建空目录并拉取代码:
创建并激活虚拟环境:
安装依赖及 torch,并启动项目:
启动项目后会自动打开浏览器窗口,默认地址是 ,样子就是上面
以上就是本篇文章【ChatTTS!可生成音效非常自然逼真的开源语音大模型】的全部内容了,欢迎阅览 ! 文章地址:http://www78564.xrbh.cn/quote/28542.html
动态
相关文章
文章
同类文章
热门文章
栏目首页
网站地图
返回首页 迅博思语移动站 http://www78564.xrbh.cn/mobile/ , 查看更多