蒙古语非特定人大词汇量连续语音识别系统的研究与实现

来源 :内蒙古大学 | 被引量 : 26次 | 上传用户:devil521zhou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别主要是指让机器听懂人说的话,即在各种情况下准确地识别出语音的内容,从而根据其信息,执行人的各种意图。它是一门涉及面很广的交叉学科,与计算机、通信、语音语言学、数里统计、信号处理、人工智能等学科都有密切的关系。蒙古语是世界范围内有影响的民族语言,在内蒙古自治区等少数民族地区广为使用。在英语、汉语等语言的语音识别已经进入实用化,而蒙古语语音识别尚处于空白的情况下,我们选择大词汇量连续蒙古语语音识别系统作为研究课题对繁荣发展少数民族文化、促进民族地区的社会进步具有重要的意义。 语音识别系统主要分为孤立词、连接词和连续语音识别系统,以及中小词汇量和大词汇量的特定人和非特定人的语音识别系统,其中特定人的孤立词、连接词的中小词汇量的语音识别系统相对容易实现且识别率较高。但非特定人的大词汇量连续语音识别系统的实现难度较大,识别率不易达到很高。但这种语音识别系统的通用性好、适应面广,是近年来语音识别的主要研究方向。 语音识别系统目前主流的研究途径是随机模型法,其中的突出代表就是基于隐马尔可夫(HMM)模型统一框架的大词汇量连续语音识别。其中在声学语音层使用三音子模型作为基本的子词单元(sub-word unit),在词层句法层使用基于双词文法(bi-gram)和三词文法(tri-gram)的统计语言模型。 本语音识别系统使用HTK作为训练和识别工具,使用三音子模型作为基本的子词单元,在词层句法层分别使用基于规则的语言模型和统计语言模型进行实验,并比较了实验结果。
其他文献
目前,模糊集理论和粗糙集理论已成为知识获取的两种重要数学工具。模糊集理论是一种用精确的数学语言对模糊性进行描述的方法,而粗糙集理论是建立在分类基础上的,将知识理解为对
学位
Native XML数据库是当前数据库领域的研究热点之一。XML文档在Native XML数据库中的存储和索引策略,是首要关心的问题。首先,本文探讨了XML与数据库的相互关系,研究了XML文档在N
人类大脑处理语音任务的过程较为复杂,已引起越来越多研究者的关注。DIVA(DirectionInto Velocities of Articulators)模型是一种神经计算模型,能够较为准确地描述语音生成和理
Ad Hoc是一个多跳、临时性的对等移动自治系统,它由一组带有无线收发装置的移动节点组成。然而由于节点能量有限、网络拓扑结构变化频繁的原因,Ad Hoc网络同样需要考虑很多传统
三维GIS建模是发展新一代GIS系统的关键技术。本文首先提出了基于面向对象思想的建模方法——聚合派生法。其基本思想是:将模型分为基础模型和应用模型两大部分,其中基础模型
对植物等非规则的自然景物的计算机生成技术的研究,自20世纪80年代开始,逐渐成为计算机图形学领域的研究热点之一。自然景物模拟是计算机图形学应用的前沿课题,而植物建模则是其
在过去的十几年里,车辆检测系统已经得到了广泛的关注,而其中基于视觉的车辆检测系统尤为突出。在这些系统中,图像分割算法对车载摄像机所获取的图像进行处理,输出初始的对象假定
众所周知,自然界各式各样的系统,如电子系统、生物系统、经济系统等,常因为发生切换现象或频率改变,以及外界瞬时扰动时会导致其系统状态在某一时刻发生突变。也就是说,这些系统
基于单幅图像的三维重建是虚拟现实、计算机图形学等领域的重要研究内容,从单幅二维图像恢复出三维信息本身属于逆向工程,存在多义性的病态问题,可以用轮廓、亮度、纹理、明
传感器网络是由传感器技术、嵌入式计算技术、分布式信息处理技术和通信技术等多学科高度交叉组成的新兴前沿热点领域,是信息感知、采集和处理的一场革命,受到了越来越多国家