基于Kaldi的罗平方言语音识别研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:zm4910588
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类信息交互的主要手段,近年来,随着科学技术的不断发展,语音识别开始应用于生活的方方面面,不过当前中文语音识别系统均是基于普通话,对于中国这样一个地域广大、民族众多的国家来说,存在着众多方言,基于普通话的语音识别系统是远远不能满足大众需求的,所以针对各地区方言的研究与应用显得尤为必要。本文简要介绍了语音识别的发展历史,阐述了语音识别技术的基本原理,认真分析了语音识别的每一项技术的诞生对语音识别发展的重要意义。.并研究了从原始的模拟语音信号采集处理到构建语言模型和声学模型的全过程中所涉及的相关技术。接下来的论述中,着重研究了语音识别的声学模型。本文所研究的声学模型包括:单音素模型、三音素模型、优化后的三音素模型、隐马尔科夫模型(HMM)、以及深度神经网络模型(DNN)。本文还对语音识别的语言模型进行了研究,在本课题中,主要研究了基于统计的N-gram模型。最后本文对罗平方言的特征进行了分析,搭建了基于Kaldi的罗平方言语音识别系统。在文中,搭建了五组对比实验,比较了在不同的声学模型、不同的语言模型及不同的训练样本数量下系统的识别准确性能。实验表明,在六种不同的声学模型中,基于DNN的声学模型识别准确率最高,高达96.82%,且基于二元文法模型的实验结果优于一元文法模型。在二元文法模型实验中,随着训练数据样本从1980条增加到2420条,系统识别正确率不断提高,这表明训练样本数据量越大,系统识别正确率越高。在此基础上,对训练样本和测试样本进行调整,测试结果表明,系统具有良好的自适应性。
其他文献
介绍了钻石结晶器铜管国产化的研制过程,并对钻石型结晶器铜管的结构特点、生产工艺、加工要点作了说明。
目的:观察人参败毒散加减治疗腹泻型肠易激综合征(肝郁脾虚证)的临床疗效、安全性及近期复发率,以期为临床上治疗IBS-D提供新的治疗思路。方法:将符合纳入标准的成都中医药大学附属医院消化科门诊的85例IBS-D肝郁脾虚证患者,按照随机对照试验的设计方法,分为治疗组43例,对照组42例,治疗组予以人参败毒散加减治疗,对照组予蒙脱石散(思密达)治疗,疗程均为4周。记录两组患者治疗前后中医证候评分、IBS
<正>文物系统改革是文化体制改革的重要组成部分,是理顺内部管理体制、进一步扩大开放的重要环节。它将有效增强中国文物在世界文物宝库中的地位,有力促进中国文物管理和文物
最近,全国人大常委会就《个人所得税修正案(草案)》公开征求意见。个人所得税起征点的高低再次成为社会各界议论的焦点。许多人纷纷指出,在目前的通货膨胀水平下,拟上调起征
煤和生物质经热解可部分转化为燃气和化学品,但该过程中产生的重质焦油利用价值低且危害设备系统安全。将热解焦油轻质化是提高燃料利用效率和气体产品质量的关键,其中催化裂
随着计算机技术的快速发展,Aspen Plus软件已成为化工设计行业广泛使用的流程模拟软件。根据我国化工设计发展的趋势、化工设计课程的教学特点和我校课程的教学现状,在化工设计
随着中韩两国文化交流的日益加深,文学作品的译介也成为一种常见的文化传播途径。散文是一种抒发作者真情实感、写作方式灵活的记叙类文学体裁,因其独特的风格深受读者的喜爱
针对普通高校直属单位基层党组织的现状,分析其原因,提出了加强高校直属单位基层党组织建设的对策和建议。
综述了应用于化妆品中的果酸的种类及其作用机理,介绍了常用的果酸检测方法及其在化妆品中的浓度限制,并简述了果酸在国内外化妆品、个人护理用品中的应用。
<正> 有些家庭种平菇,平菇产量很低,甚至绝收。究其原因主要有以下几种: 1.育菇场地选择不当 如选择在阴暗、通风不畅或不卫生的场所种植,杂菌污染严重,平菇不能正常生长;有