蒙古语语音合成系统的设计与实现

来源 :内蒙古大学 | 被引量 : 2次 | 上传用户:tomily98
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着目前科学技术水平的不断提高,人机交互手段越来越趋向于使用更符合人类交流方式的语音来进行,包括能够识别人类说话内容的语音识别技术以及能够将文字转换为语音的语音合成技术。目前,针对蒙古语语音合成的理论研究已经比较成熟,但仅停留在实验阶段,没有一款能够投入应用的语音合成系统,尤其在语音合成前端处理部分,几乎没有对用户输入的蒙古文进行除音素转换外的其他处理。为了提高蒙古族人民的人机交互体验,本文设计并实现了自然度较高的蒙古语语音合成系统。本文根据蒙古语的发音特点,标注了4709句蒙古语语音,使用基于隐马尔可夫模型的语音合成模型训练工具HTS(HMM-based Speech Synthesis System)训练了蒙古语语音合成模型,并实现了从特殊字符处理、音素转换、韵律预测、音节划分到生成标注文件的整套蒙古语语音合成前端处理流程,同时搭建了蒙古语语音合成的Web Service,可以为各类应用系统提供服务。此外,本文对训练得到的蒙古语语音合成模型合成出的语音进行了可懂度评测与自然度打分,合成语音在可懂度评测中语义不可预测句子SUS(Semantically Unpredictable Sentences)听写测试的词正确率为54.6%,主观自然度得分MOS (Mean Opinion Score)为3.42。因此,本文搭建的蒙古语语音合成系统的可懂度与自然度方面均达到了较高的水平。
其他文献
“摆酒”是传统乡村社会十分普遍的现象,尽管在各地其表现形式不尽相同,但其社会功能大同小异,即作为一种传统文化习俗,“摆酒”具有明显的社会团结与整合功能。但是随着社会
介绍了环氧树脂(EP)/碳纤维(CF)复合材料的特点及其应用;总结了EP/CF复合材料的成型工艺及每种成型工艺的优缺点。指出随着CF制备技术、表面处理技术,以及EP制备技术和固化工
网络自主学习作为落实终身教育的重要途径,伴随着网络技术的高速发展进入了我们的视野。然而,网络自主学习的效率低下,严重地影响了教育信息化和终身化的进程。在知识经济背景下
自从出现了所有权与经营权的分离,委托代理问题就一直是现代企业所关注的问题。以2008年沪深两市的上市公司为研究对象,通过实证分析后发现,上市公司高层管理人员持股与公司
目前的器官犯罪主要与器官移植有关,是科技风险在该领域的突出表现。对此,《刑法修正案(八)》第37条新增了有关器官犯罪的内容,旨在以刑法手段应对与器官犯罪有关的科技风险
由于税收与税收权利的性质具有多维性 ,因而在强调对国家不同性质的税收权利应通过不同的制度来给予保护的同时 ,也不能忽视或漠视其他主体的相关税收权利 ,唯此才能更好地实
介绍测试塑料光纤衰减的三种方法:截断法、插入损耗法和后向散射法。详述各方法的测试原理及所用装置,重点分析三种方法的特点、差异,提出测试中应注意的问题。
<正> 李寿(字神通,公元577—630年)墓位于陕西省三原县陵前公社焦村生产队(图一),1972年墓内积水,天井塌陷。为了保护地下文物,在当地贫下中农的热情支持和县文化馆的积极协
以甜玉米饮料为研究对象,通过测定离心沉淀率来确定稳定性的好坏。通过单因素实验,研究了不同稳定剂对甜玉米饮料稳定性的影响,确定单因素的最优范围,并且在单因素实验的基础
随着电信市场国际化步伐的加快,电信市场的同质化程度越来越高。市场经历了由卖方市场到买方市场的转变,以客户服务为中心的理念已经慢慢融入我国消费者的头脑中,特别是我国