推广 热搜:   公司  中国  行业  快速  设备  企业  上海  未来   

ChatTTS!可生成音效非常自然逼真的开源语音大模型

   日期:2025-01-01     移动:http://www78564.xrbh.cn/mobile/quote/28542.html

说起文生语音模型,最广为人知的肯定是 OpenAI 的 Whisper,之前试过确实很 OK,不过国内要使用比较麻烦而且收费,所以今天要说的是一款开源语音模型——ChatTTS,它在短短两个月的时间就获得了 29k 的 Star

ChatTTS!可生成音效非常自然逼真的开源语音大模型

为什么它如此受欢迎?三金觉得起码有以下三点:

  • 开源免费,个人电脑只要配置不是太差都能跑
  • 生成的语音真的很逼真,还可以加一些语气词、笑声、停顿
  • 提供 WebUI,简化操作

GitHub 地址

而在 ChatTTS 开始发力之后,它的派生项目也接踵而至,其中比较知名的就是三金部署的——ChatTTS-ui,它简化了 ChatTTS 中的 WebUI,让用户只需要关注要转化的文字、音色、语速、语气和笑声等几个常用项,并支持对外提供 API 接口

接下来我们就从项目部署、使用、及 API 接口逐一介绍~

以 Mac 电脑为例,部署超级简单!前置准备有以下三点:

  • 首先,电脑上需要有 python 3.9+ 以上的环境;
  • 其次,需要安装 git,因为需要拉项目源码,源码地址
  • 最后,需要安装可以处理音频文件的库 libsndfile 以及 ffmpeg

这样环境就搭建好了。

接下来创建空目录并拉取代码:


创建并激活虚拟环境:


安装依赖及 torch,并启动项目:


启动项目后会自动打开浏览器窗口,默认地址是 ,样子就是上面

本文地址:http://www78564.xrbh.cn/quote/28542.html    迅博思语 http://www78564.xrbh.cn/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关最新动态
推荐最新动态
点击排行
网站首页  |  二维码  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号