基于非平行语料的蒙古语语音转换研究

来源 :内蒙古大学 | 被引量 : 0次 | 上传用户:tangdeqian1102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音转换作为语音信号处理领域的重要分支,近年来受到研究者的广泛关注。在英语、汉语等主流语言的语音转换任务中,基于深度学习的语音转换方法发展迅速,已经有多种转换效果良好的方法被提出。然而,蒙古语语音转换技术的发展仍处于初级阶段,基于平行语料的蒙古语语音转换方法虽然能得到较好的性能,但构建规模较大的平行语料库对快速定制特定人员的合成语音难度较大。为了提高蒙古语语音转换技术的适用性,本文主要在非平行语料条件下对蒙古语语音转换技术进行研究。论文的主要工作如下:1.面向非平行语料的蒙古语语音转换,本文提出了一种基于CycleGAN-VC的蒙古语语音转换方法。该方法使用CycleGAN-VC网络结合对抗损失、循环一致性损失和身份映射损失对非平行语料中相同结构的频谱特征进行匹配,实现了源说话人和目标说话人之间的双向转换。由实验结果可知,转换后语音的自然度MOS和相似度MOS分别达到3.16和2.84,表明该方法在非平行语料条件下能得到较好的语音转换效果。2.针对蒙古语韵律变化丰富的特性以及CycleGAN-VC网络特征转换不稳定的问题,本文提出了一种基于细粒度韵律建模和条件CycleGAN的蒙古语语音转换方法。该方法使用连续小波变换对语音中的基频特征进行细粒度韵律建模。同时,使用说话人向量作为条件对CycleGAN网络的训练进行监督,并使用两个独立的条件CycleGAN网络对频谱特征和韵律特征分别进行转换。由实验结果可知,该方法与基线模型相比在自然度MOS和相似度MOS上分别提高0.11和0.21,表明该方法能够有效提高非平行语料条件下的蒙古语语音转换效果。
其他文献
水平基因转移(Horizontal Gene Transfer,HGT)事件广泛存在于自然界中,它帮助受体物种绕过突变及重组获得新基因,加速基因组革新进程,所以准确识别HGT事件是探究物种之间真实演化关系的重要一环。由于发生转移的基因位置倾向于通过谱系保留,因此可依据基因树与物种树之间拓扑结构不一致性对HGT事件的识别进行研究。RIATA-HGT算法是目前有效识别HGT事件的算法之一,但该算法对于
学位
内蒙古历史作为中华民族历史沃土中的一颗璀璨明珠,有着悠久的文化传承。目前历史的记载都是厚重的文本,非专业人士梳理和理解语义关系难度较大。其实RDF(Resource Description Framework,资源描述框架)用三元组集合的方式来描述客观世界事物和关系的思想满足用简单的二元关系模型描述历史知识事物关系的需求。RDF作为一种元数据语言,其三元组表达形式包含语义信息,且不受具体语法表示的
学位
调频调制是无线通信中常用的调制方式之一,它广泛的应用于卫星通信、蜂窝电话的系统、高保真的音乐广播等。但是当接收到的调频无线电信号较弱,信噪比较低时,传输过程中受到诸多畸变,会对接收端的语音的质量产生较大的影响。针对以上诸多畸变对无线通信语音信号的影响,为了保持可靠的无线电通信,同时为了降低传输过程中的诸多不确定性因素对调频语音信号的影响,设计一个高效及鲁棒的无线通信语音信号增强模型具有十分重要的意
学位
随着学术网络的不断发展,学者影响力预测得到广泛研究。该研究能够帮助各单位发现有潜力的研究人员,有助于决策者做出合理的招聘决策或资金分配。传统的学者影响力预测方法主要在同构学术网络中考虑学者的被引频次、合作关系、合作次数以及合作时间等因素,综合衡量并预测学者的影响力。而基于异构学术网络的学者影响力预测能够捕捉学术主体之间更多的互动与沟通,能更加准确地预测影响力。但在异构网络中使用随机游走模型对学者影
学位
随着车联网技术的快速发展,车联网产生的数据量急剧增加,而集中式的云计算并不能对时延敏感型的车联网任务进行高效的处理,车载设备应用的服务质量难以得到保障。移动边缘计算技术可以将云计算的资源下沉到网络边缘来保障实时性的服务需求,将边缘计算与车联网技术融合是实现时延敏感型的车联网智能应用的有效途径。本文研究面向车联网服务需求的移动边缘计算环境中边缘服务器的部署问题,充分考虑了车辆的空间性和移动性以及车联
学位
近年来,人工智能技术突飞猛进发展,可预见将深刻改变生产生活的各个方面。作为人工智能技术的代表,神经网络也为计算机视觉领域带来了新的思路,深度影响着目标检测技术的发展。行人检测作为视频监控、无人驾驶、智能机器人等方面应用的技术支撑,具有广阔的应用前景,是目标检测中最值得研究的方向之一。本文在分析了现有目标检测算法检测性能的基础上,对使用卷积神经网络基于免锚的行人检测方法展开研究。本文的主要研究内容如
学位
图像修复是恢复和还原二维图像中破损、缺失或者退化区域的信息,并且恢复的信息需要与图像的上下文语义和全局的结构、纹理保持一致。大部分深度学习的图像修复方法使用卷积神经网络对破损图像进行端到端的修复,最新的图像修复方法尝试在图像修复环节引入结构信息,并将图像修复过程划分为破损区域结构信息预测和基于结构信息的完整图像修复两个阶段,提升了图像修复效果。但是结构信息指导的图像修复仍有两个问题需要解决,其一是
学位
交通仿真系统是智能交通系统的重要研究方向之一,随着城市交通拥堵问题和各类应急事件疏散问题日益严重。如何使用计算机建模和仿真技术对应急事件疏散行为仿真和对疏散方案评估已经成为了计算机与交通领域结合的重要研究内容。现阶段,国内外对于应急疏散交通仿真系统的设计与实现较少。为此,论文提出了一套从疏散需求、疏散仿真到疏散方案评估的应急疏散交通仿真系统的设计,并进行了实现。论文主要贡献有:(1)结合出行方式和
学位
十四五规划提出以来,我国知识产权事业发展取得成效显著,并且随着创新驱动发展战略的不断实施,全社会知识产权意识也在大幅提高。专利作为知识产权的重要组成部分,专利之间的否定关系也在受到广泛关注。当前,受到各种相关战略以及政策的推动,专利的数量也在逐年攀升,专利之间的否定关系变得更加的错综复杂,这使得在专利手工审查时构造专利之间的否定关系变得越发艰难。因此,如何自动化构造专利之间的否定关系成为专利的热门
学位
能源是社会生产生活的能量和材料来源,社会的生产生活都离不开能源,体现了能源的重要性和唯一性。但在能源消费的过程中具有一定的负外部性,当市场机制无法有效对能源资金进行优化配置时,就会造成能源市场失灵。这就需要政府部门对能源市场进行及时、有效的干预指导,保证能源的合理使用,提高能源利用效率。能耗双控政策,即能源消费总量和能源消费强度双指标约束控制,是我国为促进经济向高质量发展转型升级所实施的一项我国独
学位