当前位置:首页 > 软件下载 > 媒体软件

MoeTTSv1.1.1免费版

点此纠错

  • 平台:WinAll
  • 大小:960.0M
  • 语言:简体
  • 类别:媒体软件
  • 授权:免费软件
  • 更新:2022-08-23
3.0
0% 0%

情介绍

MoeTTS是仓库发布的非常优秀的Tacotron2/HifiGAN模型+编译的GUI版本。大多数角色的语音合成效果都非常好,稍后会发布到MoeTTS项目页面。

MoeTTS是一个非常优秀的Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库。大部分角色的语音合成效果非常好,后续会发布到MoeTTS项目页面。

MoeTTS

基本介绍

MoeTTS是一个Tacotron2/HifiGAN模型+编译的GUI版本发布仓库。训练时间为3天,约900 Epoch。 13人大模型还在训练中,稍后会发布到MoeTTS项目页面。视频背后的模型是400 Epoch。经过5天的训练,大部分字符的语音合成都很好,但少数数据较少的字符则不太好。

指示

模型目录格式

单个模型可以放置在任何地方。如果模型有配置文件,请将其重命名为config.json,并将其放在与TTS模型同一目录下。 (例如hifigan、vits型号,它们都带有配置文件)

对于VITS型号,请将config.json中的cleaners更改为custom_cleaners

文本输入格式

文本一般是输入音素(日语应该在这里输入罗马发音),但是这取决于模型训练者如何输入数据。例如,我的ATRI模型(Tacotron2版本)输入罗马化时不带空格,标点符号仅支持逗号和句点。

定制清洁剂和符号

您可以在moetts.exe 的同一目录中找到custom 文件夹,该文件夹存储了两个模型的文本模块。

自定义cleaner:找到cleaners.py,修改custom_cleaners函数(软件默认只会去除symbol中不存在的字符,不会对文本进行进一步处理)

自定义符号:找到symbols.py,将里面的符号改为自己需要的符号。

注意:不同的模型可能会使用不同的清洁剂和符号进行训练。如有必要请进行修改,以保证模型能够正常使用。

如何使用图形用户界面

塔科特隆2

选择你的模型路径和输出目录,最后输入要合成的文本,点击Synthesize Speech,稍等片刻,软件就会将音频输出到输出目录/outpus.wav

防范措施:

第一次综合需要加载模型,耗时较长。如果再次合成同一个模型,则不会再次加载,直接合成。

如果切换模型,将重新加载再次合成。

如果修改了清洁剂和符号,则重新启动软件后才会生效。

该软件为64位版本,不支持32位系统。

VITS 的特别说明

VITS-Single 和VITS-Multi 分别是单角色模型和多角色模型。

VITS-Multi中的原始角色ID为待合成语音的角色ID,需要填写数字。目标角色ID为待迁移语音迁移功能的目标角色ID。

要迁移的音频需要22050、16 位和单声道的采样率。