山西朔州方言语音识别方法研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:laoyet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音作为人机交互的最重要的手段和研究形势之一,随着科学技术的发展,自动语音识别(Automatic Speech Recognition,ASR)已经应用于日常生活之中。但目前山西朔州的语音识别系统大多为普通话识别,各地方言用户只有以近似标准的普通话发音才能得到较好的识别结果。加之方言语音语料数据采集成本高,仅有少量的资源可用于研究。在低资源条件下的语音识别相关系统识别率低。所以为满足大众的交互需求和实现高识别率,针对山西朔州方言的研究与应用就显得十分必要。在此背景下,本文一方面对现有的模型进进行对比,另一方面对低资源数据进行整理,从而提高山西朔州方言的语音识别系统识别率。首先,本文对语音识别的发展史和基本原理进行了简要的介绍,随后对语音识别从模拟信号的处理到声学模型的构建以及识别等每一项关键技术进行了阐述。之后,对声学模型和语言模型进行着重研究,包括:高斯混合模型和隐马尔可夫模型(GMM-HMM)、基于深度学习的神经网络模型(DNN-HMM)以及N-gram等模型。最后,本文对山西朔州方言的语言特征、低资源和小区域进行了分析研究,对各个模型下山西朔州方言的识别进行了对比实验。本文共搭建了四组不同的对照实验,比较了不同的模型和数据量对识别性能的影响结果。在山西朔州方言研究中,首先对低资源数据和小区域中的方言地区,使用传统的高斯混合模型和隐马尔可夫模型(GMM-HMM)和基于深度学习的神经网络模型(DNNHMM)两种模型来研究低资源和小区域对语音识别性能的影响;其次,通过加大数据量,查看通过加大数据量,对小区域识别提升的影响;再次,研究基于深度学习的神经网络模型(DNN-HMM)加入共享隐藏层,对提高数据量和识别性能的提升;最后研究基于DNN的声学模型,提出不同的激活函数对语音识别效果的影响。实验表明,在四组不同的实验中,GMM-HMM声学模型在小区域和低资源数据量的情况下,识别率较高,达到了90.32%,随着数据量的加大,基于DNN-HMM声学模型的准确率逐渐提升,达到92.61%,表明数据量越多,识别越准确。共享层确实起到了增大数据量的作用。
其他文献
为实现高均匀性、高性能的NbTi/Cu多芯复合线的批量生产,需要优化多芯复合线的传统工艺。对复合线材均匀性和超导性能的研究结果表明:经优化后的拉拔-扒皮工艺完全可以取代传统
我国目前采用的近似商标的认定标准主要是依据最高人民法院出台的《关于审理商标民事纠纷适用法律若干问题的解释》第十条之规定,但司法实践中,法官认定近似商标往往是一个较主观的过程,得出的结论未免有失偏颇。本案中原告与被告双方针对商标是否近似、商标能否获得注册、商标间能否共存、商标是否构成不正当竞争等问题产生争议。认定商标近似的基准应当是一个可靠的、能反复适用的准则。首先,应当对认定商标近似要件中“相关公
人才是企业的核心。在现代企业竞争中,表面上是技术、产品、营销、管理等方面的竞争,但实际上是人才的竞争,因为所有的活动是要通过人来完成的。一个公司的成败,归根结底都是人的成败,要看企业是否拥有创新能力、营销能力的人才。特别是研发型高新技术企业中,核心人才是研发和设计的关键因素,他们的流失对企业造成的伤害是致命性的。所以如何吸引人才、用好人才、留住人才已经成为企业人力资源管理的根本。本论文通过对国有汽
印度位于南亚大陆,其面积为338万平方公里,人口达10亿.1998/1999财政年度,印度GDP增长率为6%,达到4684亿美元.迄今为止,印度已经将许多国有部门向私营部门开放,其电信业已经
自1993年以来,我国国有企业相继进行改制,实现制度创新,并在此过程中逐步加快了对外直接投资(OFDI)的步伐,OFDI规模日益扩大。但是,国有企业改制“能否”和“如何”对OFDI企业的经营绩效产生积极影响,尚无人解答。本文试图对此问题做出解答,以期更好地引导改制企业理性进行OFDI。首先,本文在文献综述的基础上,描述了国有企业改制对中国OFDI企业经营绩效影响的典型化事实。研究发现,OFDI改制
我国针对公司完成注册后的法律行为有大量的公司立法规范和劳动立法规范,而对公司设立期间的用工行为的规范条文却存在立法空白。虽然我国采取“准则主义”的公司设立登记制度,但是在实践中从发起人开始设立公司到取得营业执照需要经历一段时间过程。在这段未取得正式营业执照的时间里,也并不是无所作为的,例如公司正式营业之前的试运营,以及相关的正式营业的筹备行为。公司要完成设立目的,则不可避免的需要雇佣人力帮忙完成设
<正>名称:2012(第十二届)北京国际汽车展览会时间:2012年4月25日至5月2日地点:北京中国国际展览中心(天竺)新馆及中国国际展览中心(静安庄)2012北京车展规模再创历史新高,其
近年来,工业智能制造的飞速发展对现代产业产生了极大的推动作用,串联机械臂作为工业制造领域的关键载体对航天、汽车等制造领域正起着越来越重要的作用。尽管国外的机器人技术相当成熟,但国内在串联机械臂运动控制算法研究方面仍存在一些不足,距离实际工程应用还有一段距离。为满足高速高精度运动需求,本文从拐角光顺、奇异位形规避、位姿速度前瞻以及速度同步规划四个方面展开研究,提出了一套满足实际应用的位姿前瞻和速度同
目的:了解广东连山山区中学生对性知识、性观念及对艾滋病性行为知识与态度。方法:以2017年度广东连山山区中学生1100例为调查研究对象。按学龄分为初中组、高中组,其中初中