前馈神经网络梯度训练算法的几个收敛性结果

来源 :大连理工大学 | 被引量 : 13次 | 上传用户:venicego
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来神经网络在许多领域都得到了广泛的应用。前馈神经网络是一种构造简单而应用广泛的神经网络模型,其主要的训练算法是梯度法。为了提高算法的训练性能,人们对梯度算法作了各种改进,例如:加入惩罚项来提高网络的泛化能力,加入动量项来加快算法的训练速度并帮助跳出局部极小,引入复数值神经网络和相应的梯度算法来处理复数值信号等。如何从理论上对这些改进算法的性质(特别是收敛性)进行分析,成为神经网络领域的一个重要研究课题。本文主要研究了用于训练前馈神经网络的一些梯度算法的收敛性,并提出了一种自适应确定带动量项BP算法中动量因子的方法。具体地,本论文包括以下内容:1.在现有的关于训练前馈神经网络的在线梯度算法的文献中,大部分收敛性结果需要假设网络权值有界。而这一假设在网络实际训练中是难以验证的。即使在没有这一假设的文献中,也需要额外的更加难以验证的条件。一个自然的结果是:带有惩罚项的前馈神经网络梯度训练算法可以保证网络权值有界。但是这一结果在相关文献中并没有严格的证明。为了填补这一理论空白,本文首先严格证明了带惩罚的在线梯度算法在训练具有sigmoid输出和线性输出前馈神经网络时的权值有界性(同时利用随机逼近理论,证明了相关算法的收敛性),然后严格证明了带惩罚项前馈神经网络批处理梯度训练算法的权值有界性。2.通过对训练复数值神经网络的批处理梯度算法的研究,本文给出了一个保证误差函数单调下降的学习率的上界,并由此证明了训练算法的收敛性。这一结果为实际应用中学习率的合理选取提供了依据。通过进一步研究训练复数值神经网络的带动量项批处理梯度算法,建立了保证误差函数单调下降的学习率和动量因子之间的关系,并证明了在相应条件下的算法收敛性。3.为提高神经网络的训练速度,提出一种自适应确定带动量项BP算法中动量因子的方法。在学习率为常数情况下,根据误差函数关于权值向量的梯度变化情况,自适应调节动量因子。数值试验表明,该方法对离线和在线训练均有效,且在收敛速度和算法稳定性上优于常动量因子的BP算法。
其他文献
本文详细论述了加拿大农业博物馆与加拿大首都渥太华中心实验农场之间的渊源关系,加拿大农业博物馆是“绿色首都”渥太华的鲜活证明,渥太华是世界上唯一在城市心脏地带拥有大面
有效控制就是在批准的工程造价限额以内,随时纠正发生的偏差,保证项目投资目标的实现,以求在各个建设项目中能够合理地使用人力、物力、财力,以取得较好的投资效益,最终实现
创新精神与实践能力的培养是近年来教育部及各大高校培养人才的目标,而高校教师可以借此机遇使自身的教学与科研得到相互促进。通过将科研成果带入课堂教学中、积极开展课外
目的评价吸烟与非吸烟药物性牙龈增生患者单纯牙周非手术治疗1个月后的临床疗效。方法2007年3月至2007年12月收集河北省人民医院口腔科钙拮抗剂类药物导致的牙龈增生男性患者
本文在阐述文化营销内涵的基础上,进一步研究了我国服装企业文化营销现存问题,并在此基础上提出了我国服装企业实施文化营销策略的方法和战略。
传统的批量制造系统已难以应对激烈的市场竞争和快速的需求变化,柔性自动制造系统应运而生。对此类系统的分析与控制因而成为生产系统领域中的研究热点问题。本学位论文主要
山东是我国柞蚕生产的发源地区,其历史至少可上溯到公元前的西汉时期,但作为一项农业经营,直到清代才有显著发展。其间,柞蚕放养技术日臻成熟,生产经营规模日趋扩大,并巳成为
包装设计的发展是伴随着市场经济的繁荣、营销观念的发展、消费行为的演变、新技术新材料的应用等诸种因素促成的。系列包装设计应体现出“家族式”的面貌,才能彰显系列包装的
反馈控制系统的设计限制以及网络控制系统的性能优化问题是当今科学研究的前沿和热点问题。研究系统性能极限与控制系统的内在特性,比如,非最小相位零点、不稳定极点及其参考信
混沌运动是自然界中客观存在的、最终有界的、有一定随机规则的、非常复杂的运动形式。它广泛地存在于自然界。近十几年来,混沌科学与其它科学互相渗透,无论是在生物学、物理