具有无偏估计的深度学习自适应梯度算法的收敛性分析

来源 :东北师范大学 | 被引量 : 1次 | 上传用户:lidids
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自2006年深度学习的概念被提出以来,随着计算机硬件的不断革新,深度学习技术也得到了长足的发展。深度学习的相关应用越来越多的出现在人们的工作与生活中,例如常见推荐系统、智能语音、量化操作以及自动驾驶等。一个优秀的深度学习项目往往都是基于一个优秀的深度学习模型,而对于一个完整的模型通常包括网络、算法、数据等。一般情况下,当网络结构和数据样本固定时,一个好的优化算法往往意味着一个更加令人满意的实验结果。在深度学习的优化算法中,基于SGD算法衍生出的自适应梯度算法是一类十分简单且流行的算法,因此这一类算法仍然是TenserFlow、Pytorch等深度学习框架中的主流优化算法。作为深度学习中主流的优化算法,自适应梯度算法是基于反向传播以及梯度下降法产生的。在实践中,我们通常会根据梯度的阶数,将基于梯度的优化算法分为:一阶优化算法以及二阶优化算法。虽然二阶算法往往有着更快的收敛速度,但同时也伴随着巨大的计算量和存储量,因此一阶优化算法仍然是目前的主流算法。在基于梯度的一阶优化算法中,Adagrad、Rmsprop以及Adam算法是其中的杰出代表,因它们极为优秀的实验表现吸引了大量的研究者对自适应梯度算法进行研究。然而,当前对于自适应梯度算法的理论分析大多是以满足凸或强凸条件为前提,但深层神经网络的目标函数往往都是非凸的,因此考虑非凸条件下自适应梯度算法的收敛性分析具有重要的理论价值与现实意义。本文的前两章是对基础知识和基本概念的介绍。在第三章中我们主要分析了非凸条件下常见的自适应梯度算法的收敛性,给出了几种自适应算法在非凸条件下的收敛性证明,并结合数值实验比较了这几种算法的实验性能。在第四章前半部分,我们对传统的Rmsprop算法进行了一定的改进,提出了Rmsprop-Norm算法以及添加正则项的RmspropW-Norm算法,分析了这两种改进算法在非凸条件下的收敛性,并在RmspropW-Norm算法的分析过程中得到了可训练参数有界的结论。在第四章的后半部分我们提出了一种广义的自适应梯度算法,分析了其算法收敛性并给出一个较为直观且易于检验的算法收敛性的充分条件。在数值实验中,我们对比了两种改进算法的与原算法Rmsprop的实验结果,验证了所提出算法的有效性。
其他文献
黑洞时空测地线结构研究能够使人们间接接触黑洞核心处的引力效应,从而了解黑洞周围时空几何结构。本文通过分析有效势曲线行为,结合相平面分析方法和数值求解轨道运动方程,分别研究了有质量粒子和光子两种试验粒子在常规与修正Hayward黑洞时空中的测地线结构。结果表明:(1)在常规海沃德黑洞时空中,利用相平面法可以将有质量粒子的轨道分为四种类型:稳定与不稳定圆轨道、稳定双曲轨道和椭圆轨道。角动量的变化将直接
氧还原反应(oxygen reduction reaction)由于其在电化学能量存储和转化中的关键作用而成为研究的活跃领域。但是,氧还原反应(ORR)过程涉及复杂的多电子转移,导致缓慢的动力学,这
全球气候变暖的大背景下,我国平均增温速率明显高于北半球同期平均增温速率;与华北和东部相比,西北地区非对称性的增温幅度更大,降水形态有从降雪向降雨转变之势,天山山区亦
伴随工业化、城镇化进程加剧以及国家对农业的重视,政府通过政策逐步释放农村经济活力。盘活农村经济需要有外资注入或内生价值挖掘变现,在这一前提下,内生价值挖掘中的农民资产抵押创新亟待破冰。2016年4月,山东省人民政府发布了《关于同意山东省“两权”抵押贷款试点县(市、区)试点实施方案的批复》,标志着山东省农村“两权”抵押贷款试点工作正式开展。试点地区农民住房财产变成“活资本”,突破多年以来农民住房不能
由煤炭经甲醇转化为重要的化学品是煤炭清洁利用领域的一条重要途径。光催化甲醇直接脱氢制甲酸甲酯等重要化学品是一条新的绿色合成路线,既可以消耗甲醇缓解其产能过剩的压
牙克石地区位于大兴安岭中北段,构造上处于华北板块和西伯利亚板块碰撞拼合的中亚造山带东段。通过综合研究,将研究区晚古生代侵入岩类划分为两个时间段:其中早期的闪长岩类(274-309Ma)岩石组合为闪长岩-石英闪长岩-花岗闪长岩-英云闪长岩-二长花岗岩系列,主体展布于头道桥-乌奴耳拼贴带北西侧;晚期的狭义花岗岩类(274-309Ma)岩石组合为二长花岗岩-正长花岗岩系列,在拼贴带两侧均有分布,主体分布
纳米酶是一类具有类酶催化活性的纳米材料,以其易于制备、价格低廉、稳定性好、贮存时间长等优势而成为新一代天然酶的替代品,在生物分析、成像、治疗、环境保护等方面具有广
工业机器人广泛应用于汽车、机械、化工、电子电气和食品行业,是智能制造的基础设备,关节伺服系统是工业机器人控制的基本单元,直接影响其性能。传统PID控制抗扰动性能较差,
自1978年以来中国城市化发展不断推进,城市中的公共设施和房地产行业飞速发展。电梯行业作为房地产行业的附属行业,市场需求也明显增加,尤其是对新型电梯产品的供求不足问题
对于星地卫星通信,传统的微波通信方式由于容量的限制使其发展遇到瓶颈,而自由空间光通信(Free Space Optics Communication,FSOC)由于有着高容量、保密性高、可以重复利用的频谱资源等优点成为星地卫星通信的最佳选择。在FSOC系统中,空间光束一般需要耦合进入光纤再使用成熟的光纤通信器件提升系统性能。然而大气湍流导致的传输光束波前相位畸变会影响自由空间光束与光纤的耦合效率。