最新推荐
-
齐鲁银行网银助手3.0.0.5官方版 安全软件 / 3.0M
-
360安全卫士U盘病毒专杀(Autorun.inf专杀)13.0.0.213简体中文绿色免费版 安全软件 / 86.1M
-
360安全卫士U盘病毒专杀工具v13.0.0.213绿色免费版 安全软件 / 86.1M
-
360安全卫士修复工具v13.0.0.213免费版 安全软件 / 86.1M
-
360安全卫士超强查杀V13.0.0.213安装版 安全软件 / 86.1M
精品推荐
-
金舟虚拟摄像头v2.1.2官方版 媒体软件 / 155.4M
查看 -
EV投屏v2.1.0官方版 媒体软件 / 45.6M
查看 -
腾讯视频电脑版v11.81.5035.0官方版 媒体软件 / 88.1M
查看 -
旋风视频转换器v2.4.0.0官方版 媒体软件 / 19.4M
查看 -
水印云v2.3.1官方版 媒体软件 / 119.0M
查看
本类排行
详情介绍
MoeTTS是仓库发布的非常优秀的Tacotron2/HifiGAN模型+编译的GUI版本。大多数角色的语音合成效果都非常好,稍后会发布到MoeTTS项目页面。
MoeTTS是一个非常优秀的Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库。大部分角色的语音合成效果非常好,后续会发布到MoeTTS项目页面。
基本介绍
MoeTTS是一个Tacotron2/HifiGAN模型+编译的GUI版本发布仓库。训练时间为3天,约900 Epoch。 13人大模型还在训练中,稍后会发布到MoeTTS项目页面。视频背后的模型是400 Epoch。经过5天的训练,大部分字符的语音合成都很好,但少数数据较少的字符则不太好。
指示
模型目录格式
单个模型可以放置在任何地方。如果模型有配置文件,请将其重命名为config.json,并将其放在与TTS模型同一目录下。 (例如hifigan、vits型号,它们都带有配置文件)
对于VITS型号,请将config.json中的cleaners更改为custom_cleaners
文本输入格式
文本一般是输入音素(日语应该在这里输入罗马发音),但是这取决于模型训练者如何输入数据。例如,我的ATRI模型(Tacotron2版本)输入罗马化时不带空格,标点符号仅支持逗号和句点。
定制清洁剂和符号
您可以在moetts.exe 的同一目录中找到custom 文件夹,该文件夹存储了两个模型的文本模块。
自定义cleaner:找到cleaners.py,修改custom_cleaners函数(软件默认只会去除symbol中不存在的字符,不会对文本进行进一步处理)
自定义符号:找到symbols.py,将里面的符号改为自己需要的符号。
注意:不同的模型可能会使用不同的清洁剂和符号进行训练。如有必要请进行修改,以保证模型能够正常使用。
如何使用图形用户界面
塔科特隆2
选择你的模型路径和输出目录,最后输入要合成的文本,点击Synthesize Speech,稍等片刻,软件就会将音频输出到输出目录/outpus.wav
防范措施:
第一次综合需要加载模型,耗时较长。如果再次合成同一个模型,则不会再次加载,直接合成。
如果切换模型,将重新加载再次合成。
如果修改了清洁剂和符号,则重新启动软件后才会生效。
该软件为64位版本,不支持32位系统。
VITS 的特别说明
VITS-Single 和VITS-Multi 分别是单角色模型和多角色模型。
VITS-Multi中的原始角色ID为待合成语音的角色ID,需要填写数字。目标角色ID为待迁移语音迁移功能的目标角色ID。
要迁移的音频需要22050、16 位和单声道的采样率。