Clone Voice - 声音克隆工具
Clone Voice 是一个简单易用的声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。
项目使用模型源于 Coqui Ai TTS ,模型协议为 CPML 只可用于学习研究,不可商用,请勿用作其他用途。
支持中文、英文、日语、韩语 4 种语言,可在线从麦克风录制声音或上传声音(仅支持 WAV
格式)。英文效果很棒,中文效果还凑合。
下载:
请前往 Github Releases 页面查看作者提供的最新下载方式。如果是百度网盘,可以参考百度网盘加速服务。
使用方法:
- 从项目仓库或百度网盘下载预编译版本。有2个压缩文件(合计约 3~4 GB),放在同一目录解压。您可能需要安装一个支持分批压缩包的解压软件,(解压后合计约 6~7 GB)
- 移动解压文件到某处,比如
E:/clone-voice
下 - 双击运行
start.bat
或app.exe
文件,等待片刻,即自动打开一个浏览器本地网页,鼠标点点就能用。 转换操作步骤:
- 在文本框中输入文字、或导入
srt
文件,或者选择 [声音-> 声音] ,选择要转换的声音wav
格式文件 - 然后从 [要使用的声音 wav 文件] 下拉框中选择要用的声音,如果没有满意的,也可以点击 [本地上传] 按钮,选择已录制好的
5-20s
的wav
声音文件。或者点击 [开始录制] 按钮在线录制你自己的声音,录制完成点击使用 - 点击 [立即开始生成] 按钮,耐心等待完成。
- 在文本框中输入文字、或导入
了解更多:
- 使用不限制显卡,没有 N 卡 GPU 也可以使用
- 为保证合成效果,建议录制时长 5 秒到 20 秒,发音清晰准确,不要存在背景噪声
- 仅支持
WAV
格式音频,其他格式可以使用转换工具转换