更新于2025年7月29日,最新科大讯飞语音识别---文字转语音(超级详细的步骤)
·
1.来到官网
2.找到语音合成
3.免费试用
免费试用
立即试用

立即领取

4.自己去注册下账号
5.添加应用,并免费下单
添加应用
配置应用

选免费套餐

往下翻,下单
下载后回到,官网主页

6.下载SDK
找到SDK入口

我这里喜欢使用旧版页面,新版也是一样的

选择应用和SDK版本

点击确定

下载后记得点击跳转到控制台


7.SDK下载好后,来控制台查看官方文档
找到文档入口
在线语音合成 Linux SDK 文档 | 讯飞开放平台文档中心

8.跟着官方文档操作即可
解压。
并在虚拟机中找到它。

打开终端执行命令(命令在图片中有解释)
cd Linux_tts_online1227_94e50e16/samples/tts_online_sample/
ls
source 64bit_make.sh

切换到bin目录,运行程序
cd ../../bin/

检查Linux是否联网,ping百度看一下,我这里是将虚拟机设置为了NAT模式,自动分配IP地址(默认就是自动)。
ping baidu.com

执行程序
./tts_online_sample

如果报错:说没有libmsc.o这个动态库的话

就用下面的命令执行程序
LD_LIBRARY_PATH=../libs/x64/ ./tts_online_sample

分析下源码(Linux_tts_online1227_94e50e16---samples---tts_online_sample路径下)

根据源码来看,合成的音频就放在了当前的bin路径下,名字叫 “tts_sample.wav”。要合成的话就是那个text字符串。
运行后的结果

在Windows中找到并自己播放下:
9.切换音色和文本
回到控制台,查看自己可以用的音色:
有基础版和特色版,我以特色版为例子:

添加你想要的音色
复制音色参数

打开Linux_tts_online1227_94e50e16---samples---tts_online_sample路径下的代码tts_online_sample.c,并更改。
在回到linux编译这份代码,并运行
source 64bit_make.sh
./tts_online_sample

播放下音频(音频同样是放在bin目录下的):

注意:文字中有特殊符号如空格、星号、表情等,则在其后面的文字可能不会合成语音
10.帮到你的话,记得点赞哦。
更多推荐


所有评论(0)