ChatTTS！可生成音效非常自然逼真的开源语音大模型

ChatTTS！可生成音效非常自然逼真的开源语音大模型

2025-01-01 11:00

说起文生语音模型，最广为人知的肯定是 OpenAI 的 Whisper，之前试过确实很 OK，不过国内要使用比较麻烦而且收费，所以今天要说的是一款开源语音模型——ChatTTS，它在短短两个月的时间就获得了 29k 的 Star。

为什么它如此受欢迎？三金觉得起码有以下三点：

GitHub 地址

而在 ChatTTS 开始发力之后，它的派生项目也接踵而至，其中比较知名的就是三金部署的——ChatTTS-ui，它简化了 ChatTTS 中的 WebUI，让用户只需要关注要转化的文字、音色、语速、语气和笑声等几个常用项，并支持对外提供 API 接口。

接下来我们就从项目部署、使用、及 API 接口逐一介绍～

以 Mac 电脑为例，部署超级简单！前置准备有以下三点：

这样环境就搭建好了。

接下来创建空目录并拉取代码：

创建并激活虚拟环境：

安装依赖及 torch，并启动项目：

启动项目后会自动打开浏览器窗口，默认地址是，样子就是上面