论文部分内容阅读
本文中,我们对现有语音转换方法进行分析,并针对频谱弯曲方法相似度较低的问题,将频谱弯曲与单元挑选相结合以提高与目标人频谱细节上的相似度。我们首先利用频谱弯曲来获得弯曲后的源频谱。然后,我们利用弯曲后的源频谱作为预测目标从目标说话人频谱中进行单元挑选。最后,我们用挑选出来的目标说话人频谱对弯曲后的源频谱进行部分替换,以提高频谱细节上的相似度。评测结果表明,改进的方法与单纯的频谱弯曲相比能够获得约20[%]的相似度提高。文章最后提出了进一步的改进方向。