最新动态
ChatTTS!可生成音效非常自然逼真的开源语音大模型
2025-01-01 11:00

说起文生语音模型,最广为人知的肯定是 OpenAI 的 Whisper,之前试过确实很 OK,不过国内要使用比较麻烦而且收费,所以今天要说的是一款开源语音模型——ChatTTS,它在短短两个月的时间就获得了 29k 的 Star

ChatTTS!可生成音效非常自然逼真的开源语音大模型

为什么它如此受欢迎?三金觉得起码有以下三点:

  • 开源免费,个人电脑只要配置不是太差都能跑
  • 生成的语音真的很逼真,还可以加一些语气词、笑声、停顿
  • 提供 WebUI,简化操作

GitHub 地址

而在 ChatTTS 开始发力之后,它的派生项目也接踵而至,其中比较知名的就是三金部署的——ChatTTS-ui,它简化了 ChatTTS 中的 WebUI,让用户只需要关注要转化的文字、音色、语速、语气和笑声等几个常用项,并支持对外提供 API 接口

接下来我们就从项目部署、使用、及 API 接口逐一介绍~

以 Mac 电脑为例,部署超级简单!前置准备有以下三点:

  • 首先,电脑上需要有 python 3.9+ 以上的环境;
  • 其次,需要安装 git,因为需要拉项目源码,源码地址
  • 最后,需要安装可以处理音频文件的库 libsndfile 以及 ffmpeg

这样环境就搭建好了。

接下来创建空目录并拉取代码:


创建并激活虚拟环境:


安装依赖及 torch,并启动项目:


启动项目后会自动打开浏览器窗口,默认地址是 ,样子就是上面

    以上就是本篇文章【ChatTTS!可生成音效非常自然逼真的开源语音大模型】的全部内容了,欢迎阅览 ! 文章地址:http://www78564.xrbh.cn/quote/28542.html 
     动态      相关文章      文章      同类文章      热门文章      栏目首页      网站地图      返回首页 迅博思语移动站 http://www78564.xrbh.cn/mobile/ , 查看更多