更新于2025年7月29日，最新科大讯飞语音识别---文字转语音（超级详细的步骤）

凹凸曼107

803人浏览 · 2025-07-29 23:17:48

凹凸曼107 · 2025-07-29 23:17:48 发布

1.来到官网

讯飞开放平台-以语音交互为核心的人工智能开放平台

2.找到语音合成

3.免费试用

免费试用

立即试用

立即领取

4.自己去注册下账号

5.添加应用，并免费下单

添加应用

配置应用

选免费套餐

往下翻，下单

下载后回到，官网主页

6.下载SDK

找到SDK入口

我这里喜欢使用旧版页面，新版也是一样的

选择应用和SDK版本

点击确定

下载后记得点击跳转到控制台

7.SDK下载好后，来控制台查看官方文档

找到文档入口

在线语音合成 Linux SDK 文档 | 讯飞开放平台文档中心

8.跟着官方文档操作即可

解压。

并在虚拟机中找到它。

打开终端执行命令（命令在图片中有解释）

cd Linux_tts_online1227_94e50e16/samples/tts_online_sample/

ls

source 64bit_make.sh

切换到bin目录，运行程序

cd ../../bin/

检查Linux是否联网，ping百度看一下,我这里是将虚拟机设置为了NAT模式，自动分配IP地址（默认就是自动）。

ping baidu.com

执行程序

./tts_online_sample

如果报错：说没有libmsc.o这个动态库的话

就用下面的命令执行程序

LD_LIBRARY_PATH=../libs/x64/ ./tts_online_sample

分析下源码（Linux_tts_online1227_94e50e16---samples---tts_online_sample路径下）

根据源码来看，合成的音频就放在了当前的bin路径下，名字叫 “tts_sample.wav”。要合成的话就是那个text字符串。

运行后的结果

在Windows中找到并自己播放下：

9.切换音色和文本

回到控制台，查看自己可以用的音色：

有基础版和特色版，我以特色版为例子：

添加你想要的音色

复制音色参数

打开Linux_tts_online1227_94e50e16---samples---tts_online_sample路径下的代码tts_online_sample.c,并更改。

在回到linux编译这份代码，并运行

source 64bit_make.sh

./tts_online_sample

播放下音频（音频同样是放在bin目录下的）：

注意：文字中有特殊符号如空格、星号、表情等，则在其后面的文字可能不会合成语音

10.帮到你的话，记得点赞哦。

AI硬件创业社区

智能硬件社区聚焦AI智能硬件技术生态，汇聚嵌入式AI、物联网硬件开发者，打造交流分享平台，同步全国赛事资讯、开展 OPC 核心人才招募，助力技术落地与开发者成长。

更多推荐

【亲测免费】哔哩哔哩聊天机器人 `bilibot` 教程

`bilibot` 是一个基于哔哩哔哩（B站）用户评论数据微调训练的本地聊天机器人。它支持文字交互，并且可以通过特定的问题文本生成语音对话。项目采用Qwen1 5-32B-Chat作为基础模型，并利用苹果的mlx-lm LORA技术进行模型微调。此外，它还集成了GPT-SoVITS项目来实现语音生成功能。## 2. 项目快速启动### 安装环境确保已安装Python 3.10，推荐使用

AI硬件创业社区

cover

【Zephyr|ESP32-S3】基础学习：用WiFi UDP socket实现远程控灯，基于多生产者模式的双通道命令控制

AI硬件创业社区

使用burp suite拦截抓包

页面一闪而过是PHP执行完输出flag后立刻发送302重定向跳转，浏览器直接跳过中间页面。切换标签到代理（proxy）子标签HTTP历史，找到目标URL，双击这条请求。切换至响应（response），在响应头下方的文本可以直接读取flag。- Preserve log会缓存所有请求完整响应；- Burp拦截直接阻断跳转，完整留存输出文本。- 普通刷新会丢失中间页面内容；在burp的内嵌浏览器打开。

AI硬件创业社区

所有评论(0)

查看更多评论

凹凸曼107

已为社区贡献3条内容