手机版

手机软件

排行榜

热门：手机钱包交易所口袋妖怪

当前位置：首页 > 软件下载 > 媒体软件

MoeTTSv1.1.1免费版

点此纠错

平台：WinAll
大小：960.0M
语言：简体
类别：媒体软件
授权：免费软件
更新：2022-08-23

本地下载

3.0

0% 0%

最新推荐

精品推荐

专题推荐

本类排行

1
金舟虚拟摄像头v2.1.2官方版

媒体软件 / 155.4M

查看
2
EV投屏v2.1.0官方版

媒体软件 / 45.6M

查看
3
腾讯视频电脑版v11.81.5035.0官方版

媒体软件 / 88.1M

查看
4 旋风视频转换器v2.4.0.0官方版
5 水印云v2.3.1官方版
6 万彩特效大师v2.7.00官方版
7 凡人SWF视频转换器v16.5.0.0官方版
8 Free Resize Video(视频大小调整软件)v1.06官方版
9 剪映专业版v4.4.0官方版
10 E渲效果图版二线(ERender)v1.6.3.0官方版

详情介绍

MoeTTS是仓库发布的非常优秀的Tacotron2/HifiGAN模型+编译的GUI版本。大多数角色的语音合成效果都非常好，稍后会发布到MoeTTS项目页面。

MoeTTS是一个非常优秀的Tacotron2/HifiGAN模型+编译好的GUI版本发布仓库。大部分角色的语音合成效果非常好，后续会发布到MoeTTS项目页面。

MoeTTS

基本介绍

MoeTTS是一个Tacotron2/HifiGAN模型+编译的GUI版本发布仓库。训练时间为3天，约900 Epoch。 13人大模型还在训练中，稍后会发布到MoeTTS项目页面。视频背后的模型是400 Epoch。经过5天的训练，大部分字符的语音合成都很好，但少数数据较少的字符则不太好。

指示

模型目录格式

单个模型可以放置在任何地方。如果模型有配置文件，请将其重命名为config.json，并将其放在与TTS模型同一目录下。（例如hifigan、vits型号，它们都带有配置文件）

对于VITS型号，请将config.json中的cleaners更改为custom_cleaners

文本输入格式

文本一般是输入音素（日语应该在这里输入罗马发音），但是这取决于模型训练者如何输入数据。例如，我的ATRI模型（Tacotron2版本）输入罗马化时不带空格，标点符号仅支持逗号和句点。

定制清洁剂和符号

您可以在moetts.exe 的同一目录中找到custom 文件夹，该文件夹存储了两个模型的文本模块。

自定义cleaner：找到cleaners.py，修改custom_cleaners函数（软件默认只会去除symbol中不存在的字符，不会对文本进行进一步处理）

自定义符号：找到symbols.py，将里面的符号改为自己需要的符号。

注意：不同的模型可能会使用不同的清洁剂和符号进行训练。如有必要请进行修改，以保证模型能够正常使用。

如何使用图形用户界面

塔科特隆2

选择你的模型路径和输出目录，最后输入要合成的文本，点击Synthesize Speech，稍等片刻，软件就会将音频输出到输出目录/outpus.wav

防范措施：

第一次综合需要加载模型，耗时较长。如果再次合成同一个模型，则不会再次加载，直接合成。

如果切换模型，将重新加载再次合成。

如果修改了清洁剂和符号，则重新启动软件后才会生效。

该软件为64位版本，不支持32位系统。

VITS 的特别说明

VITS-Single 和VITS-Multi 分别是单角色模型和多角色模型。

VITS-Multi中的原始角色ID为待合成语音的角色ID，需要填写数字。目标角色ID为待迁移语音迁移功能的目标角色ID。

要迁移的音频需要22050、16 位和单声道的采样率。

同类应用

↑