Low-Resource Mongolian Speech Synthesis Based on Automatic Prosody Annotation
什么是低资源,在语音合成领域其实可以从两方面考虑:
- 语料数据少,即成对的<text, audio>少,表现就是整体录音时长短;
- 标注数据少,没有 text 与 audio 的对齐信息,没有 text 更多的标注信息,如韵律,情感等
此文主要是参加“全国人机语音通讯学术会议(NCMMSC)”中的特别会议“面向蒙古语的低资源语音合成竞赛”,会议地址http://mglip.com/challenge/NCMMSC2022-MTTSC/index.html