FishAudio 克隆你的声音
这样,可以在生成的每一段声音之后, 出现大约 0.5秒的停顿。经过大约 20秒钟,可以生成合成的音频文件。录制完之后,便可以导入,进行克隆声音。特别是它可以比较方便的通过大约 90秒的音频文件,来克隆任意语音音色的声音。此外, 还提供了精确控制多音字, 音效, 情绪的方法。观察合成的声音波形, 可以看到,在每一句话之间, 存在大约 500ms 的时间间隔。利用这些间隔,通过Python编程,
Fish Audio 配音软件
01 FishAudio克隆你的声音
一、介绍
Fish Audio 软件可以将文字转换成语音文件。 这个软件界面, 提供了非常多的功能。 特别是它可以比较方便的通过大约 90秒的音频文件, 来克隆任意语音音色的声音。 此外, 还提供了精确控制多音字, 音效, 情绪的方法。 下面测试一下这个软件的功能。

二、克隆声音
首先让我们来看一下克隆声音的过程。 这个过程非常简单。 利用计算机录音软件。 选择自己之前一段视频, 将其中的声音录制。 音频时长最短10秒钟, 最长 90秒。 最佳录制是时长为 30秒钟。 录制完之后,便可以导入,进行克隆声音。 在界面中, 可以看到, 能够选择新生成声音文件。 下面利用它可以进行文字到声音的转换了。



三、切分声音
为了能够更好应用生成的音频文件, 使得它们能够与视频解说保持同步。 这里使用了 Fish Audio 中的停顿控制符号。 也就是在每一句话后面插入圆括号包围着的 long break 控制符号。 这样, 可以在生成的每一段声音之后, 出现大约 0.5秒的停顿。 经过大约 20秒钟, 可以生成合成的音频文件。 下载文件, 便可以用于后期视频合成。

观察合成的声音波形, 可以看到, 在每一句话之间, 存在大约 500ms 的时间间隔。 利用这些间隔,通过Python编程, 可以将音频文件分割成一系列的声音文件。 这些文件都是以语句文字作为命名。 在后期进行视频合成的过程中,依次播放,并同时显示字符。


※ 合成效果 ※
本文测试了Fish Audio配音软件的功能。 这个视频音频就是利用这个软件合成的视频。 有了这个工具,可以为今后视频制作提供更好的音频合成选择。

■ 相关文献链接:
更多推荐



所有评论(0)