MENU

Clone Voice - 声音克隆工具

Clone Voice

Clone Voice 是一个简单易用的声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。

Clone Voice

项目使用模型源于 Coqui Ai TTS ,模型协议为 CPML 只可用于学习研究,不可商用请勿用作其他用途

支持中文、英文、日语、韩语 4 种语言,可在线从麦克风录制声音或上传声音(仅支持 WAV 格式)。英文效果很棒,中文效果还凑合。


下载:

请前往 Github Releases 页面查看作者提供的最新下载方式。如果是百度网盘,可以参考百度网盘加速服务


使用方法:

  1. 从项目仓库或百度网盘下载预编译版本。有2个压缩文件(合计约 3~4 GB),放在同一目录解压。您可能需要安装一个支持分批压缩包的解压软件,(解压后合计约 6~7 GB)
  2. 移动解压文件到某处,比如 E:/clone-voice
  3. 双击运行 start.batapp.exe 文件,等待片刻,即自动打开一个浏览器本地网页,鼠标点点就能用。
  4. 转换操作步骤:

    • 在文本框中输入文字、或导入 srt 文件,或者选择 [声音-> 声音] ,选择要转换的声音 wav 格式文件
    • 然后从 [要使用的声音 wav 文件] 下拉框中选择要用的声音,如果没有满意的,也可以点击 [本地上传] 按钮,选择已录制好的 5-20swav 声音文件。或者点击 [开始录制] 按钮在线录制你自己的声音,录制完成点击使用
    • 点击 [立即开始生成] 按钮,耐心等待完成。

了解更多:

  • 使用不限制显卡,没有 N 卡 GPU 也可以使用
  • 为保证合成效果,建议录制时长 5 秒到 20 秒,发音清晰准确,不要存在背景噪声
  • 仅支持 WAV 格式音频,其他格式可以使用转换工具转换
最后编辑于: 2024 年 06 月 08 日
返回文章列表 文章二维码 打赏
本页链接的二维码
打赏二维码