蒙古语语音关键词检测技术的研究

来源 :内蒙古大学 | 被引量 : 3次 | 上传用户:victinfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年随着计算机多媒体技术的快速发展,蒙古语的教育、影视、文化等诸多方面的语音资料越来越多,已形成了丰富的民族文化资源。如何对这些语音文档进行有效地检索和分类成为了蒙古文信息处理领域中的一个热点问题。语音关键词检测技术是根据用户给定的查询,从指定的语音数据集中返回与其对应的语音片段。本文针对蒙古语语音关键词检测任务中涉及到的一些相关技术进行了深入的研究,包括蒙古语大词汇量连续语音识别(LVCSR)技术、基于网格和混淆网络的蒙古语关键词检测技术和蒙古文字母到音素的转换技术等。本文研究的蒙古语语音关键词检测相关技术不仅具有重要的学术价值,并对维护国家安全及边疆少数民族地区的稳定,繁荣和发展少数民族文化具有重要意义。论文所做工作主要集中在以下几个方面:1.蒙古文属于黏着语,是词根缀加多个后缀的形式构成新词,通过这种方式可以生成大量的蒙古文单词,这给蒙古语大词汇量连续语音识别的研究工作带来了很大的困难。为了解决大规模蒙古文单词的识别问题,本文根据蒙古文的构词特点,提出了基于分割识别的蒙古语LVCSR方法。本文详细描述了蒙古语语音识别技术的基本原理,并且针对基于分割识别的蒙古语LVCSR方法,重新建立了声学模型和语言模型。实验结果表明,基于分割识别的蒙古语LVCSR方法可以较好的解决蒙古语大词汇量连续语音识别问题,并且在训练声学模型时,校正结尾后缀的发音会提高识别的准确率。本文提出的基于分割识别的蒙古语LVCSR方法对其他黏着语的语音识别和语音检测等领域的研究提供了新的思路和方法。2.本文将基于网格和混淆网络的关键词检测首次应用到蒙古语关键词检测任务中,并结合蒙古文的构词特点对集内词检测方法进行了改进。本文详细描述了基于词网格的蒙古语关键词检测方法中的后验概率的估计、搜索和置信度计算等问题。其次,介绍了网格转换混淆网络的方法和基于词混淆网络的蒙古语关键词检测中的索引的建立、关键词搜索和确认等方法。最后,结合蒙古文构词特点,提出了基于词干进行检测的集内词检测方法。实验结果表明,基于词混淆网络的检测方法从各个性能上都好于基于词网格的检测方法,并且改进的集内词检测方法有效的提高了系统的性能。3.为了解决蒙古语关键词检测任务中的集外词检测问题,本文提出了基于音素混淆网络的蒙古语关键词检测方法。蒙古语语音文件被解码成音素形式时正确识别率会变得很低,并会出现很多不符合韵律学的发音序列。为了提高系统的精准率和召回率,我们采用了音素混淆矩阵改进了关键词的置信度计算方法,并得到了较好的实验结果。本章首先介绍了对音素混淆网络文件建立索引的方法。其次,详细介绍了音素混淆矩阵。第三,描述了在音素混淆网络文件中搜索和确认音素串的方法。第四,介绍了蒙古语关键词检测系统的框架。最后对相关方法进行了实验比较。实验结果表明,基于音素混淆网络的蒙古语关键词检测方法可以较好的解决集外词的检测问题,并且采用音素混淆矩阵的置信度计算方法提高了系统的整体性能。4.为了解决蒙古文集外词到音素串的转换工作,本文提出了蒙古文字母到音素的转换方法。蒙古语关键词检测任务中对集外词进行检测时需要将集外词转换成对应的音素串形式,然后通过音素串进行查找,因此蒙古文字母到音素的转换系统变得极其重要。蒙古文的书面形式和口语发音不是一一对应的,会出现元音和辅音的增加、脱落及变换等现象,这给蒙古文字母到音素的转换工作带来了一定的难度。针对蒙古文字母到音素的转换问题本文提出了基于规则的蒙古文字母到音素的转换方法和基于联合序列模型的蒙古文字母到音素的转换方法。实验结果表明,利用联合序列模型的蒙古文字母到音素的转换方法要明显好于基于规则的蒙古文字母到音素的转换方法。并且,我们建立的基于联合序列模型的蒙古文字母到音素的转换系统的词误识率为16.32%,音素误识率仅为3.37%,基本达到了实用要求。
其他文献
下咽为咽部的最低部分,是上呼吸消化道的一个组成部分,与喉体声门上相延续,是一非常主要的解剖部位。由于其解剖的特殊性,下咽部小的原发肿瘤早期很少有症状,也很难诊断,因此,大多数
目的:探讨应用电视胸腔镜技术全程游离胸段膈神经用于膈神经移位修复臂丛神经损伤。方法:从2005年03月至2007年01月,在5例臂丛神经损伤患者中应用电视胸腔镜(Video assisted tho
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
伴随微传感器、处理器和无线通信技术的发展,由大量节点通过无线连接组成的无线传感器网络得到大家的关注,被广泛应用于工业、农业、医疗和军事等领域。无线传感器网络可以做很
无线传感器网络是由大量具有信息感知和数据通信的传感器节点组成,通过无线通信方式形成多跳自组织的无线网络,其目的是协同地实时监测、感知和采集网络覆盖区域中各种环境或监
线性速写作为速写最为主要的艺术语言来表现人物的形象、形体、动态等造型的艺术效果,在我们的学习和训练中,要求绘画者针对人物的形象、动态特征用简练、概括的线条去刻画表
AIM To design a fuzzy expert system to help detect and diagnose the severity of diabetic neuropathy. METHODS The research was completed in 2014 and consisted of
以高校文创设计为主体,针对当前市场上高校文创设计中,运用校园建筑为设计元素的设计方法。结合具体设计案例,分析设计中应注意的问题。研究在文创设计中如何更好地利用校园
中国墓园植物的运用随着人类历史发展及人类价值观的演变而不断变化,墓园作为人类社会中的重要活动场所之一,其植物的运用受人们价值观、地域性、宗教、自然与艺术所影响。本
通过对艺术体操项目特点的分析,结合心理测试对艺术体操运动员的心理特征进行了研究.结果表明,自信心和果断性是优秀艺术体操运动员应该具备的心理特征.