基于LSTM神经网络的语音模型优化研究

来源 :广西师范学院 | 被引量 : 0次 | 上传用户:shayneinfo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在机器智能技术日新月异的发展,语音智能识别技术作为提高人机交互效率的一种手段,已经成为机器智能技术领域中不可分割的一部分,其应用性日渐提高,受到大众普遍认可与广泛使用。然而,在开发语音识别模型阶段时所需消耗大量的计算资源与训练时间,成为限制语音识别技术进一步完善和发展的因素。因此,如何在语音识别模型开发阶段快速训练模型和降低所需计算资源要求是具有重要的理论及实际意义。本文主要研究了在基于长短时记忆循环神经网络的语音识别模型开发阶段中,造成长短时记忆循环神经网络训练速度慢的主要因素和如何加快网络的训练速度和减少网络所需的计算资源。本文主要工作如下:1.本文提出在基础循环神经网络输出层添加分类器的方法来分解输出层计算过程,改善循环神经网络输出层运算过程复杂的问题,达到降低网络输出层计算复杂度的目的。实验结果表明在网络输出层添加分类器的优化输出层结构的方法是可以降低网络输出层的运算复杂度的。2.针对长短时记忆循环神经网络中的门激活值是稀疏的,而且某些门激活值之间呈现出一定的线性关系。本文提出一种线性表示负向关系门激活值的方法,来变相缩减们的数量,降低网络门整体的计算复杂度,提高网络学习效率。实验结果表明,本文方法在保证一定的识别精度前提下提高了网络训练效率。3.本文改进的长短时记忆循环神经网络与CNN神经网络、FSMN神经网络进行了实验分析,实验结果表明:基于改进后的长短时记忆循环神经网络的语音识别模型的识别性能更好。
其他文献
以CdSe/ZnS量子点为荧光探针,基于多巴胺对CdSe/ZnS量子点的荧光猝灭效应,建立了一种可快速测定多巴胺的荧光检测方法。在最优实验条件下(pH7.4,反应时间20min),多巴胺浓度在0.
在课堂教学过程中教师应如何有效地开展个性化教学,提高学生听说读写能力?将任务模式下的故事改编与学习风格的培养相结合,可以收到较好的教学效果。通过合理运用课本及相关有趣
氧化钼(MoO3)本是一种绝缘体,但通过还原处理,使Mo+6转化为Mo+5和Mo+4的混合态,即可变成半导体特性,可用于薄膜场效应晶体管(TFTs)的研制。此外,从结构角度看,α-MoO3-x具有明显
在有限元分析的基础上,运用断裂力学的知识,采用应力强度因子和J积分准则,分析了补强层(半刚性基层)在旧水泥混凝土路面加铺层中的抗裂作用以及相应的加铺层的受力特性.
目前,计算飞机滑行距离的理论公式需要许多参数值,这些参数值通常采用线性内插法和随机取样法得到,但综合修正系数(IMC)却要基于飞机的滑跑长度列线图。由于公式中的IMC取决
<正> 新生儿先天性胃肌层发育不全,因部份肌组织缺损引起的胃穿孔较少见,我室尸解时遇见2例。均为女性,年龄分别为3天及12天。尸解所见:剖开腹腔见胃扩张及肠管明显充气,腹腔
可持续发展理论是针对现代工业文明带来的生态环境恶化以及人类未来发展危机问题提出的新理论,是对传统发展观念的扬弃与超越。在全球呼吁可持续发展的时代背景下,邓小平作为
象喻批评是中国古代文学批评方法中的一种重要而独特的方式,这种方式最根本的特点就在于批评家借助一些生动具体、含蓄隽永的形象或意境来喻示解释对象的内在风神和整体韵味
目的探讨气管切开术治疗重型脑外伤的临床治疗效果。方法选取我院2017年5月~2018年5月中收治的80例重型脑外伤患者,随机分为对照组和观察组,各40例,对照组采用气管插管治疗,
<正>建立商业数据库,集纳商业信息和新成果、新知识建立商业会话组织,促进对话与交流,整合创新商业资源组织专家学者和商业精英探索商业经验和发展模式,引导企业提升创新力组