基于CNN-RNN的维-哈-柯语言的语音识别系统单元优化研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:zlh888617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络的发展及其在自然语言信息处理任务中的优异表现给多语种信息处理,尤其是维-哈-柯语言的信息处理带来了新的机遇。神经网络高维度以及长距离的建模能力对维-哈-柯和多语言多媒体信息的处理提供新的活力。本文在基于CNN-RNN等神经网络框架下以词汇派生类少数民族语言为例研究并实现了完整的语音识别系统。从黏着性语言的特点出发在优化语音模型和语言模型研究上做了探索。同时在具有相似词法结构的维-哈-柯语言的基础上做了多语言语音及文本预处理软件系统。首先根据派生类词法特点,开发一个维-哈-柯多语言统一用户界面的集成信息处理软件环境,对维-哈-柯语言自然语言处理研究工作,特别派生类语言的文本及语音等信息的预处理等工作带来巨大便利。该系统从语音、词素、词、句子等多个层面上对维吾尔语、哈萨克语和柯尔克孜语等3种派生类黏着性语言进行声学及形态多个层面上分析,将繁杂的归一化、单元切分等工作集成到一个工程内,完成一系列预处理工作。该系统在少量人工语料“词-词素”平行粒度序列上进行统计模型的训练,对维-哈-柯语的词素切分准确率分别达到96%,92%,88%。本系统在语言和功能上可扩展,可嵌入独立的统计模型。基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。我们在较小的维吾尔语语料库(THUYG公开语料库)上进行了深入研究,采用Kaldi开源语音识别平台将深度的CNN-HMM作为声学模型,通过理论分析和对比实验,分别在N-gram和RNN两种语言模型上进行对比实验。传统连续语音识别技术的主流代表是GMM-HMM声学模型和N-gram语言模型,但是其识别率不高。所以本文将会使用循环神经网络语言模型取代N-gram语言模型,与不同深度的CNN-HMM声学模型搭配来提升维-哈-柯语言语音识别识别率。基于神经网络的语音识别系统效率及准确率比传统方法有了很大提高。实验结果表明基于神经网络RNN语言模型的系统有更好的识别效果,提升了维吾尔语语音识别准确率,并将词素错误率降到15.06%。
其他文献
在传感器网络的诸多应用中,传感器网络内的目标跟踪已成为研究热点。通过监测网络内传感器节点相互合作对目标进行感知和定位,并将跟踪目标相关信息处理之后反馈用户的过程,
随着3D显示技术的迅猛发展,将其应用到船舶行业来克服传统显控系统的缺陷,已成为当前船舶领域中重要的研究课题之一。显控系统是轮船上不可或缺的软件系统,它负责显示设备信
随着科学技术的高速发展,数据正呈高维、海量的趋势发展。如何对庞大的数据进行分析和处理,从中找到对用户决策有价值的信息,是数据库技术领域的研究重点之一。因此,Skyline
目的:对江苏省滨海县连续三年在滨海县人民医院参加由财政支撑的全民免费健康体检的滨海县常住人口的一般情况和脂肪肝患病情况的研究,确定引起脂肪肝发生、发展的危险因素,为制定本地区脂肪肝、高血糖、高血脂等与生活方式息息相关的慢性疾病的干预方案提供理论依据和有益指导。从而最大程度的发挥全民免费健康体检的效用,降低本地区慢性病发病率,提高本地区慢性病管理能力和管理水平,为落实健康中国2030计划添砖加瓦。方
2018年2月28日,三六零安全科技股份有限公司正式在上交所举行上市仪式。三六零从美国退市时的市值约为588亿元人民币,而按照2018年2月28日收盘价格,三六零市值高达3850亿元人民币,比在美国退市时市值整整翻了6倍多。再看业绩,根据公开数据,2014年至2016年,三六零营业收入均不到100亿元,2017年上半年收入53亿元。一家年收入不过百亿的公司,能否撑得起近4000亿元的市值?针对上述
哺乳动物的生物时钟精确调控着自身行为和生理活动,包括机体的活动周期、体温、激素分泌、血压以及基础代谢进程,使其产生24小时为周期的节律性变化。机体的生物时钟系统包括位于下丘脑视交叉上核细胞(hypothalamic suprachiasmatic nucleus,SCN)内的中枢性生物时钟和广泛分布于外周组织中的外周性生物时钟。地球自转将光和非光信号周期性地传递至中枢性生物时钟系统,驱使其产生主时
随着多媒体技术和互联网的迅速发展,以及数字存储设备成本的不断降低,导致图像数量每天以指数级的速度在增长,面对数量如此巨大的图像数据,传统的场景分类方法变得不再有效。
在空中战场上,快速和准确地识别目标对整个战场的部署与决策产生了非常大的影响,也是在战争取得胜利的关键。因此,有效的目标识别技术对于防空作战至关重要。现代战场环境复杂多变,单靠一个传感器进行目标识别已经远远不能满足现代战场的需要,而利用多个传感器提取的信息进行融合,可以建立更加完整的目标识别模型,从而有利于提高目标识别率。然而,传感器由于受到自身品质和外在因素的影响,所获得信息可能是不完整或者不确定
党的十九届四中全会公报中指出,要坚持一切行政机关为人民服务,对人民负责,要建设人民满意的服务型政府。作为政府部门的工作人员,其公共服务动机影响到自身工作行为与绩效,从而影响到服务型政府的建设,深切关系到服务人民的“最后一公里”。政府的服务涉及到人民群众生活的各个方面,其中作为基础设施的公路,属于准公共产品,其可以为社会提供服务,在社会经济和各方面发展中具有及其重要的作用。公路系统的公务人员是公路的
随着科学技术的不断进步,人类社会在经济高速增长的同时,也面临着日益恶化的生态环境问题,人们开始意识到生态环境问题,生态教育逐渐受到重视。在生态文明建设背景下,我国高校生态教育的地位越发重要,但是我国高校生态教育起步较晚,发展速度缓慢,生态教育效果不明显。日本一直致力于发展环境教育,并且大学环境教育水平处于世界领先地位。日本政府通过健全的政策法规、完善的环境教育体系、使用多种的教学途径等,形成了具有