源码介绍

这是一个使用火山引擎语音合成技术开发的文本转语音项目,它包含前端和API接口端的源代码,并且是开源的、无加密的,支持二次开发。本项目提供了一个网页在线版生成工具,前端采用Bootstrap V4框架编写。只需要将POST接口替换为自己的PHP接口即可进行个性化定制和集成开发,简单易用。

注意说明

本工具采用在线语音合成API,HTTP接口(一次性合成-非流式)合成语音,关于HTTP接口、和Websocket接口请查看下方的接口区别说明,本工具支持UTF-8编码1024 字节的文本合成(约300字)!

接口区别

HTTP接口(一次性合成-非流式)

是的,这个接口输入的参数合成语音的文本,长度限制 1024 字节(UTF-8编码)。如您需要更长的文本合成,您可使用长文本语音合成接口

Websocket接口

websocket支持的文本能长一点,但是也不建议很多文本哈,也有可能会报错,目前建议单次合成控制在1024 字节UTF-8编码),300汉字以内

其他介绍

火山引擎是由中国科学院自动化研究所开发的人工智能语音技术平台,目前已经涵盖了语音识别、语音合成、声纹识别、语音情感识别等多项技术。其中,火山引擎的TTS语音合成技术尤为出色。

TTS(Text-To-Speech)是指将文本转换为语音的技术。火山引擎的TTS语音合成技术可以将输入的文本实时转换为自然流畅的人声,其效果接近人类的自然语音,同时支持多种语言和方言的语音合成。火山引擎提供了API接口,方便用户在自己的应用中集成TTS语音合成功能。

火山引擎的TTS语音合成技术使用了深度学习、语音信号处理、声学建模等多种技术,在提高语音质量、降噪、语调自然等方面都取得了不错的效果。同时,火山引擎的TTS语音合成技术还支持定制化语音合成,即可以根据不同用户的需要,通过收集少量语音数据来训练个性化的语音合成模型,以达到更好的效果。

总的来说,火山引擎的TTS语音合成技术在语音质量、支持语种、可定制化等方面都具有较高的水平,是一项非常优秀的人工智能语音技术。

使用说明

1、上传源码至服务器,将权限设置为“777”

2、修改“api.php”文件中的key信息为自己的

$appid = "238****026";
$token = "y8lXHkAUH3b********2cDhdUixb0";
$uid = "210&****672";//非必须

3、访问主页即可开始语音合成

更新记录

2024-08-15 V4

  • 新增停顿、组词连续、变速、变调、变音量、多音字等功能处理

2024-08-14 V2

  • 更新全新的Bootstrap v5作为基本框架
  • 实现句尾静音(句尾静音时长)、音频编码格式、语速、音调、音量等控制基本组件
  • 新增分类赛选:适配场景、音色类型、情感风格、语言类型,请采用json数据实现自动填充,用户选择对应场景,自动匹配对应音色类型、情感风格、语言类型
  • 新增SSML合成方式,
  • 因为合成文本长度限制 1024 字节(约300字),所以新增字符数限制判断,超过字符数限制则弹窗提示,避免发起合成失败的无效操作

2023-05-12 V1

  • 采用Bootstrap v4作为基本框架,实现语音合成基本功能
  • 实现语速、音调、音量等控制基本组件
  • 配置了所有免费使用的发音人id
  • 实现合成、播放、下载等基本逻辑

截图展示

截图仅展示核心功能部分

火山引擎TTS语音合成(文字转语音)前端+API接口网站源码插图

火山引擎TTS语音合成(文字转语音)前端+API接口网站源码插图

火山引擎TTS语音合成(文字转语音)前端+API接口网站源码插图

1.使用本站下载的源码仅限于个人学习和非商业用途。
2.禁止将本站下载的源码用于搭建或支持任何违法、淫秽、暴力或侵犯他人合法权益的网站或应用。
3.使用本站下载的源码需遵守国家法律法规及相关规定,不得从事任何违法活动。
4.如若本站内容侵犯了原著者的合法权益,请联系我们进行处理。