特定目标说话人的语音转换系统设计

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:hrbhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换是保存某一个说话人(源说话人)的内容不变,同时把说话特征向指定的一个说话人(目标说话人)进行转换。而对于语音的转换在许多方面已经有相应的应用,因而对语音的转换效果的要求也是越来越高。在语音转换中效果较好的方法有高斯混合模型(Gaussian Mixture Model,GMM)。虽然该方法比其它方法效果更好,但是该方法的效果还达不到另人满意的程度。因此,对现有的语音转换方法的效果进行改进显得尤为重要。本文主要任务是改善转换语音的质量与目标倾向性,在讨论和研究该基本算法的基础上,对语音转换中的训练部分与转换部分进行了相应的改进。具体的工作与创新如下:1.本文对发声的声道模型、各种语音转换技术、GMM、基频转换、特征提取和评价方法等方面进行了研究。在此基础上实现了基于GMM的语音转换系统。同时,在该语音转换上提出了对时间对齐部分的两点改进。这两点改进是语音首尾有声端点检测与改进的动态时间规划(Improved Dynamic Time Warping,IDTW)。最终实验结果表明,该基于GMM的语音转换系统可以把源语音的特征向目标语音的特征进行转换。2.传统方法的转换部分都是逐帧进行转换的,这种方法很容易导致相邻帧之间的信息缺失。针对信息缺失的问题,文中加入相邻特征(Adjacent Feature,AF)的改进。最终增加了相邻帧之间的关联性并提高了转换语音的自然度。3.语音是时变且非平稳的,传统的语音转换的准确性较差。针对特征参数转换准确性问题,本文在对所有数据先使用K-means进行聚类后再对每个分类里的数据分别进行训练与转换。该算法的改进使特征的转换更有针对性并得到了倾向性更好的转换语音。4.为了使转换语音的自然度与目标倾向性同时得到提升,文章在原语音转换方法上同时使用相邻特征与聚类进行改进。这种结合的方法同时继承了两种改进方法的优点并最终使转换语音的自然度与目标倾向性同时得到了提升。
其他文献
本文阐述了建筑安装工程造价的特点,分析了影响建筑安装工程造价的因素及建筑安装工程造价管理中存在的问题,提出了解决建筑安装工程造价问题的对策。
本文首先探讨了建筑工程外墙保温的几种形式及其优缺点,然后提出了外墙保温材料所要求的性能,最后介绍了几种常用的外墙保温材料,谈了谈外保温技术未来发展方向。希望同行工作人
无线传感器网络节点的能源、计算能力和带宽都非常有限,传统的无线路由协议不适合无线传感器网络,设计能够有效节约能源、延长网络生命周期的路由协议成为了无线传感器网络研究
当前环境的适应性与环境工程有着密不可分的联系,同时环境的适应性与生态环境也有着密不可分的联系。对于不同的环境系统有着其不同的环境适应性,这样对于其环境的预防方式就不
互联网的快速、健康发展使网络业务流量监测系统的重要性日益突出,它能对特定网络以及网络所承载的各类业务进行及时、准确的流量和流向分析。网络通信技术为网络业务流量监
语音转换是指改变一个人(源说话人)的语音个性特征使之具备另一个人(目标说话人)的语音个性特征,从而使源说话人的语音听起来像目标说话人的语音的一种语音处理技术。随着现代
近年来,电信网综合通信能力明显增强,运营商必须提供更多的多媒体业务才能吸引住用户,因此网络面临的压力越来越大。在这一发展背景下,基于软交换技术的下一代网络(NGN)技术应运
随着各种通信网络的发展,网络融合技术一直是业界研究的热点问题。尤其在无线通信领域,将逐渐成熟的AdHoc网络与传统的蜂窝网络结合起来,互相取长补短,已成为改善网络性能,节约网
点云处理技术,正随着数据测量技术的发展而快速发展。该技术以点作为物体重建的基础,对物体绘制与重建的速度的提高、大规模数据处理能力的加强、及计算机处理量的加大等具有
推广实施建筑物外墙外保温技术既有利于国家可持续发展,延长建筑物使用寿命,又有利于家家户户节省日常开支,是大势所趋。对节约能源与保护环境的要求不断提高建筑维护结构的保温