前馈神经网络梯度学习算法收敛性分析

被引量 : 25次 | 上传用户:zcxwlh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络具有很强的非线性映射能力,受到了众多研究人员的关注,且已经成功应用于各个领域。最速下降法是神经网络训练中应用最为广泛的学习算法。对应两类不同的执行方式:批处理学习和增量学习。增量学习方式又包括固定次序、特定随机和完全随机三种形式。鉴于标准的反向传播神经网络的训练速度慢、泛化能力差的弊端,加入动量项、惩罚项是改进网络训练的常见方法。本文研究内容集中于前馈神经网络基于梯度法若干特定形式下的收敛性分析。本文结构与内容安排如下:第一章回顾神经网络的一些相关背景知识。第二章考虑双并联神经网络的批处理算法收敛性,给出了误差函数的单调性结论,并证明了该算法的弱收敛和强收敛性定理。通过数值实验验证了算法收敛性结论,同时比较了双并联神经网络同普通前馈神经网络在函数逼近和数据预测的性能表现。第三章考虑神经网络基于固定次序和特定随机算法的收敛性,给出了这两种算法的弱、强收敛性证明,即误差函数梯度趋于零和权值序列收敛到固定点。对比现有收敛性结果,在活化函数和学习率的限制上均有较大程度弱化;收敛性结果不仅包括对于S-S型神经网络(隐层和输出层活化函数均为Sigmoid型函数),并且包括P-P,P-S和S-P型神经网络,这里S代表活化函数是多项式函数。第四章考虑带动量项三层前馈神经网络,网络训练中样本分布按固定次序和特定随机次序呈现给网络。对每一个训练回合开始前,动量项因子采用重赋零策略。给出了相应的弱、强收敛性证明,且保证了动量项因子在更宽泛条件下的收敛性结论。并且,收敛性结论可以扩展至更多类型的神经网络。第五章考虑带惩罚项前馈神经网络,这里惩罚项取权值的二范数形式。学习过程对应固定次序和特定随机这两中算法。学习率参数放松为本身发散、平方收敛这一定性条件,相应的收敛性如弱、强收敛性均得到了证明。特别地,算法训练过程中的权值有界性结论得到了保证。
其他文献
来氟米特作为一种新型免疫抑制剂,最初主要用于类风湿关节炎治疗。近年基础和临床研究表明,本品对其他风湿免疫性疾病和肾脏疾病等治疗具有较好的临床疗效。本文综述来氟米特
教师批评学生,是唤起学生对自己不良行为的警觉,终止学生不良行为。恰当使用能指点迷津、启迪心智,如使用不当,不但达不到教育的目的,反而可能引起教师与学生之间的隔阂。真
随着我国隧道建设快速发展,大断面小净距隧道将日益增多,新奥法应用于大断面隧道尤其2扩4大断面小净距隧道的设计、施工仍然处于探索和验证阶段。由于大断面小净距隧道结构型
纤维桩因其弹性模量与牙本质相当,且具有美观、操作简便等优点,在临床上得到广泛的应用。目前,国内外对纤维桩粘接技术的研究主要集中在纤维桩的表面处理及粘接树脂等方面。
<正>人们常说,游子的思乡之情有时并不来自于心,而是缘自于胃。中国人的胃是很挑剔的,不像英国人这般无欲无求,能将面包夹一切吃一辈子。丰富多元的饮食文化让国人的胃打上了
以2007年聊城地区不同月份的中巴资源影像为数据源,根据小麦不同成长周期叶绿素含量的变化规律,对其长势进行了监测,得到了该地区农作物长势优劣等级图。
<正>现行公务员录用考试,公共笔试科目包括行测与申论两科。申论试卷一般由注意事项、给定资料和作答要求三部分构成。作答要求即考试设问,准确理解设问与所附的相关要求,是
饮用水水质直接影响着人们的身体健康,因此需要对饮用水质量展开检测,气相色谱在实际应用中具有分离效能高、检测性能强等优点,能够提高水质检测的准确性和检测效率,具有较高
以某装置变换炉为例,利用ANSYS对其下封头的带弯头接管进行有限元应力分析,经计算得出该部位的应力分布状态,评定其强度满足相关标准要求。同时针对弯头承载能力进行安全可靠的
为了吸引更多的外资和先进技术来我国发展,开发区成为重要的载体,同时其也享有很多的优惠政策,但是随着社会的发展和时间的推移,当初设立的很多优惠政策或者到期,或者被调整