Fish Audio 配音软件

 

01 FishAudio克隆你的声音


一、介绍

  Fish Audio 软件可以将文字转换成语音文件。  这个软件界面, 提供了非常多的功能。 特别是它可以比较方便的通过大约 90秒的音频文件, 来克隆任意语音音色的声音。 此外, 还提供了精确控制多音字, 音效, 情绪的方法。   下面测试一下这个软件的功能。

G3M1756860798_1920_1080.MP4|_-3

二、克隆声音

  首先让我们来看一下克隆声音的过程。 这个过程非常简单。  利用计算机录音软件。  选择自己之前一段视频, 将其中的声音录制。   音频时长最短10秒钟, 最长 90秒。 最佳录制是时长为 30秒钟。 录制完之后,便可以导入,进行克隆声音。   在界面中,  可以看到, 能够选择新生成声音文件。 下面利用它可以进行文字到声音的转换了。

G8M1756861223_1920_1080.MP4|_-8

三、切分声音

  为了能够更好应用生成的音频文件,  使得它们能够与视频解说保持同步。  这里使用了 Fish Audio 中的停顿控制符号。  也就是在每一句话后面插入圆括号包围着的 long break 控制符号。  这样, 可以在生成的每一段声音之后, 出现大约 0.5秒的停顿。 经过大约 20秒钟, 可以生成合成的音频文件。  下载文件, 便可以用于后期视频合成。

G6M1756860600_1920_1080.MP4|_-6

  观察合成的声音波形,  可以看到, 在每一句话之间, 存在大约 500ms 的时间间隔。 利用这些间隔,通过Python编程,  可以将音频文件分割成一系列的声音文件。  这些文件都是以语句文字作为命名。  在后期进行视频合成的过程中,依次播放,并同时显示字符。

G5M1756860355_1920_1080.MP4|_-5

 

成效果 ※


  文测试了Fish Audio配音软件的功能。  这个视频音频就是利用这个软件合成的视频。  有了这个工具,可以为今后视频制作提供更好的音频合成选择。

G3M1756861817_1920_1080.MP4|_-3


■ 相关文献链接:

Logo

智能硬件社区聚焦AI智能硬件技术生态,汇聚嵌入式AI、物联网硬件开发者,打造交流分享平台,同步全国赛事资讯、开展 OPC 核心人才招募,助力技术落地与开发者成长。

更多推荐