具有内部和外部存储的循环神经网络模型的研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:wcyzlh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工神经网络已经被证实在自然语言处理,语音信号处理,图像处理等领域都有着良好的表现,循环神经网络作为人工神经网络模型的一种,常被用于处理各类时序任务,这主要得益于它对时序信息的记忆能力。记忆作为循环神经网络中最重要的机制之一,在提升网络学习能力方面起着重要作用。一个好的记忆机制可以让网络把输入信号与长期记忆信号相结合,共同参与到输出信号的决策当中,从而提升网络的学习能力。然而,传统的循环神经网络模型并不能进行长期有效的记忆,一方面是由于学习矛盾问题(即:输入矛盾问题,输出矛盾问题,记忆矛盾问题)的影响,使网络很难学习到有用的记忆信号,另一方面是由于网络受到了梯度消失问题和记忆容量问题的影响使其无法进行长期有效的记忆。针对上述问题,本文创新性的提出了两种新型循环神经网络模型,分别是:带有内部记忆单元和外部记忆矩阵的循环神经网络模型(RNN-IEM),和带有门控记忆单元和外部记忆矩阵的循环神经网络模型(RNN-GEM)。总的来说,本文的创新点如下:1.针对传统循环神经网络所面临的记忆矛盾问题,梯度消失问题和记忆容量问题,本文提出了一种带有内部记忆单元和外部记忆矩阵的循环神经网络模型(RNN-IEM)。内部记忆单元由一个线性记忆单元组成,它可以用来单独储存记忆信号,解决记忆矛盾问题的影响。此外,记忆单元的线性设计允许网络的误差信号可以恒定的向之前时刻传播,使网络有能力解决梯度消失问题。外部记忆矩阵用来对模型的记忆信息进行结构化存储,这有效消除了记忆容量问题的影响,增强了网络的记忆能力。此外,本文还结合误差截断技术为提出的模型设计了高效的学习算法,使模型能够在解决上述问题的同时还能够进行高效训练。2.针对传统循环所面临的输入和输出矛盾问题,本文基于提出的RNN-IEM模型,设计了一种具有门控记忆单元和外部记忆矩阵的循环神经网络模型(RNN-GEM),该模型与RNN-IEM模型有着相似的结构,不同之处在于隐含层的结构不同,RNN-GEM模型的隐含层不再由带有内部记忆单元的神经元构成,而是由门控记忆单元构成,门控记忆单元的引入使得模型对输入信息和输出信息的决策不再单一的由权重信号来决定,也把门控单元的影响加入到了其中,这有效解决了输入和输出矛盾问题。此外,为了使提出的RNN-GEM模型能够完成高效的训练,本文为该模型也提出了高效的学习算法,进一步增强了网络的学习能力。最后,本文在Embedded Reber Grammar(ERG)序列生成任务,Synthetic World Model(SWM)问答任务,Language Understanding(LU)实体识别任务三种不同的任务上对提出的模型进行了实验,实验结果证实了本文提出的模型结合设计的算法,能够在解决上述问题的同时还拥有突出的表现。
其他文献
目的:①比较所有研究对象及各组间CAP与PAP的关系;及其在新疆维吾尔族、汉族中所有研究对象及各组间是否有差别。②探讨尿微量蛋白与CAP及PAP的关系,及其在维族、汉族间的差
堆石料是土木、水利等工程建设中普遍使用的材料,受颗粒破碎及排列、级配、石料成因、渗透性等因素影响,其强度与变形特性描述非常复杂。堆石料的强度变形特征,不仅受其宏观
近年来计算机的计算能力不断提高,卷积网络被广泛的应用到图像处理任务之中,计算机视觉领域中各项视觉任务的检测性能得到了提高。目标检测任务是计算机视觉领域的重要任务之
随着社交网络的不断发展,社区发现已经成为复杂网络领域的一个重要的研究热点。若干个社区组成了一个完整的网络,在社区的内部,节点之间的连接相对紧密,而社区与社区之间节点
在文献中,有关影响回指消解的因素探究仍无一致定论。有些学者认为回指消解与先行词有关(Caramazza et al.,1977;Nicol et al.,1989;赵冬梅、刘志雅,2006;李榕,2016;吴明军、
社交事件发布及参与平台越来越受到人们的关注,这种线上与线下相结合的全新方式不仅具有传统的线上交流功能,而且将网络社交放到了现实,其主要功能是为用户提供一种社交事件
随着工业生产设备的自动化水平不断提高,现代工业过程更趋向于集成化、复杂化和智能化。如何准确及时地排除生产过程中的故障,对于保证生产安全至关重要。近几年,传感器技术
近年来,随着定位技术的发展和附有GPS功能的智能设备的普及产生庞大规模的轨迹数据,同时,随着大数据处理方式的不断发展进步还有人们不断变化的市场需求,人们逐渐可以发现并
人工智能和计算机视觉等学科的飞速发展为数字图像处理的相关研究与应用提供了更为广泛的支撑。图像分割作为数字图像处理的重要研究之一,是模式识别、目标检测等领域的重点
信息时代数据量激增,有海量的数据需要加以分析和利用,数据聚类作为一种高效的数据分析方法得到广泛应用。由于传感器异常、数据传输不稳定、数据存储不完善等因素都可能造成