论文部分内容阅读
歌声合成的研究,作为语音合成研究的一个分支,得到广泛的关注。在深度学习框架下需要庞大的数据集进行训练,才能保证网络具有较高的泛化能力。现有的开源汉语歌声数据库无法满足歌声合成训练的特殊需求。本文利用数据增强基于小规模数据进行时域和频域的处理来扩充数据规模。实验结果显示,扩充后的数据集,可以在歌声编码器中有效的区分出更多的歌者的音色。