FishAudio 克隆你的声音

这样，可以在生成的每一段声音之后，出现大约 0.5秒的停顿。经过大约 20秒钟，可以生成合成的音频文件。录制完之后，便可以导入，进行克隆声音。特别是它可以比较方便的通过大约 90秒的音频文件，来克隆任意语音音色的声音。此外，还提供了精确控制多音字，音效，情绪的方法。观察合成的声音波形，可以看到，在每一句话之间，存在大约 500ms 的时间间隔。利用这些间隔，通过Python编程，

卓晴

1298人浏览 · 2025-09-03 12:00:30

卓晴 · 2025-09-03 12:00:30 发布

Fish Audio 配音软件

FishAudio

01 FishAudio克隆你的声音

一、介绍

Fish Audio 软件可以将文字转换成语音文件。这个软件界面，提供了非常多的功能。特别是它可以比较方便的通过大约 90秒的音频文件，来克隆任意语音音色的声音。此外，还提供了精确控制多音字，音效，情绪的方法。下面测试一下这个软件的功能。

G3M1756860798_1920_1080.MP4|_-3

二、克隆声音

首先让我们来看一下克隆声音的过程。这个过程非常简单。利用计算机录音软件。选择自己之前一段视频，将其中的声音录制。音频时长最短10秒钟，最长 90秒。最佳录制是时长为 30秒钟。录制完之后，便可以导入，进行克隆声音。在界面中，可以看到，能够选择新生成声音文件。下面利用它可以进行文字到声音的转换了。

G8M1756861223_1920_1080.MP4|_-8

三、切分声音

为了能够更好应用生成的音频文件，使得它们能够与视频解说保持同步。这里使用了 Fish Audio 中的停顿控制符号。也就是在每一句话后面插入圆括号包围着的 long break 控制符号。这样，可以在生成的每一段声音之后，出现大约 0.5秒的停顿。经过大约 20秒钟，可以生成合成的音频文件。下载文件，便可以用于后期视频合成。

G6M1756860600_1920_1080.MP4|_-6