深度学习中三步加速梯度算法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:xuxinhuiaishu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在训练机器学习和深度学习的模型时,梯度下降算法是一个用得非常广泛的优化方法。然而梯度下降算法收敛速度非常慢,因此许许多多的加速算法被提出用来加快收敛速度,比如动量法(momentum)。基于梯度下降算法、Polyak动量算法和Nesterov加速梯度算法的研究,本论文发现当目标函数是比较简单的二次函数情形时,它们都可以由同一初始点收敛到最优点,只是收敛步数不同而已。结合二次函数收敛性质,Nesterov加速梯度算法迭代步骤中的姐妹序列,以及神经网络中的平行切线法,我们提出了三步加速梯度算法。同Nesterov加速梯度算法不同的是,我们的算法拥有三个序列而不是姐妹序列。通过二次函数的实验我们得出三步加速梯度算法比其它三种算法收敛步数都要少。我们又将二次函数的维数增高许多来验证我们算法的优越性。我们还将其扩展到非二次函数情形,采用了 CUTE函数集中的FLETCHCR函数,结果显示我们算法的收敛速度更快,动量参数的取值范围也更广,即算法更稳健。然后我们将三步加速梯度算法融入到深度学习反向传播算法和随机梯度算法中,重写了 R软件包neuralnet,命名为supneuralnet。利用supneuralnet包可以计算本论文中所有有关深度学习的算法。最后利用四个案例展示出我们的算法比其它算法更优。
其他文献
市政污泥产量逐年递增,污泥含水率过高是限制其进一步处理处置的主要因素之一。传统的离心及帯式压滤机等机械脱水方式获得的脱水泥饼含水率仅能降到80 wt%左右。本文以上述
动脉中膜平滑肌细胞(SMCs)迁移进入内膜和增生是动脉粥样硬化发生的关键环节,并受包括PDGF、IGF、FGF、EGF在内的多种因素的影响。众所周知,SMCs自身亦可合成及分泌生长因子
为了解决在数控车床上加工斜椭圆的问题,提出了采用编制宏程序的方法解决该问题,该方法利用勾股定理和三角函数关系逐点算出相关坐标,采用较为简单的宏程序技巧。通过该程序
目前,全球经济发展快速,各国之间在进行频繁的贸易与交流的同时,也促进了港口物流集装箱运输行业的迅猛发展,港口物流业也因此面临了前所未有的机会和挑战。现代集装箱码头业
量子人工智能是量子力学和人工智能技术结合的产物。一个量子系统具有相干性,即该系统有可以同时存在多种状态组合的特性。这种特性使得将量子系统作为计算比特时,会有先天并
电力企业想要让自己的施工技术在市场竞争中脱颖而出,就要加强对细节问题的研究,发展电力工程安装施工的核心技术,不 断突破技术壁垒,寻找与企业相关的发展模式,提高施工技术
参考30t级机型建立挖掘机式冲击器两种典型工况姿态的三维模型,将模型导入ANSYS Workbench中建立较高网格精度的有限元模型。对工作装置进行模态分析获得两种工况的频率和振型
基于单片机控制的自动循迹机器人系统可广泛涉及于探测、工业、生活中.循迹机器人是一个应用传感器、控制器、驱动及外加扩展的自动化技术,按照预先设定的模式或者轨迹来进行
虚拟机器人作为一项新兴的教育项目,并没有系统的教材支撑,在编程教学上教师只能依循个别软件说明书中的例子分别讲解,出现教无可教、习题单一、学生厌倦等问题。本文结合教
随着我国经济建设的不断发展,越来越多的基础工程建设将投入实施。我国又是一个地震多发国家,广阔的国土面积上分布着大大小小的地震断裂带,因此越来越多的桥梁在近断层区域