深度学习中基于一阶梯度信息的随机梯度法

来源 :贵州大学 | 被引量 : 0次 | 上传用户:fantasy1998
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理论上,深度神经网络优化可以看作求解高维空间中的非线性优化问题,因此,优化方法在深度学习中扮演重要角色。在基于随机梯度下降的学习方法中,梯度估计修正与学习率调整对于提高算法的收敛速度和稳定性具有重要的作用。本文基于一阶梯度信息的随机梯度法,从梯度估计修正与学习率调整出发,研究了降低随机梯度方差的一阶梯度算法与二阶拟牛顿算法,主要内容有:针对随机梯度法的高方差所带来的损失函数值震荡问题,本文基于随机方差衰减梯度法并对梯度估计采取加权平均策略和指数衰减策略,降低随机梯度方差;针对学习率调整问题,充分利用历史梯度信息对学习率进行自动调整,提出了自适应随机方差衰减梯度法。基于MNIST和CIFAR-10数据集,验证本文所提出的自适应随机方差衰减梯度法的有效性。实验结果表明,自适应随机方差衰减梯度法在收敛速度和收敛过程稳定性方面优于随机方差衰减梯度法和随机梯度下降法。针对高阶梯度优化方法在深度学习中的巨大计算量问题,本文给出了基于一阶梯度信息近似Hessian矩阵的L-BFGS方法,通过改变训练集的选取方式,给出了改进L-BFGS方法的多批量L-BFGS方法,保证了收敛过程的平稳性;详细分析了学习率衰减策略对多批量L-BFGS方法收敛速度与稳定性的影响,给出了两种学习率固定衰减策略。在数值算例中,基于MNIST和CIFAR-10数据集验证了多批量L-BFGS方法的有效性,相对于一阶优化算法,多批量L-BFGS方法在收敛速度与稳定性方面表现更佳。
其他文献
太阳能作为一种安全、清洁的能源是全球各国的研发重点,尤其是光伏实现了跃升式的发展,各种新型光伏电池的光电转换效率不断有新的突破。十数年来,有机无机杂化钙钛矿材料作为一种有更高的光吸收系数、较长的载流子扩散距离、带隙可以优化等优异光电性质的新型半导体材料,受到研究学者的重点关注。尽管科学家们不断探索高效率的钙钛矿太阳能电池并取得显著进展,目前仍存在许多科学问题未研究透彻,比如高质量钙钛矿薄膜的生长机
学位
目前我国同步辐射和X射线自由电子激光的建设成果显著,对高精度光学元件的需求量大大增加。而光学元件的表面质量和面形误差对光学系统整体的稳定性及传输波的波前质量是至关重要的,所以在加工制造亚纳米级精度的X射线反射镜时,对检测测量技术提出了极高的挑战。目前实现高精度平面光学元件面形测量的方法主要为干涉检测,此类干涉测量方法的精度主要受参考镜加工水平的限制,绝对检测方法能够去除参考镜的表面面形误差,实现超
学位
凸集和凸映射、广义凸集和广义凸映射,分别是凸性理论和广义凸性理论的主要研究内容之一,在不等式理论、线性与非线性规划、约束与无约束优化、多目标规划、博弈论、不动点理论、非线性分析等研究中有非常重要的应用。凸度量空间中的W-凸集与W-凸函数分别是线性空间中标准凸集与标准凸函数的推广,是两类重要的广义凸性。本论文的目的是对凸度量空间中的一些W-凸性集合与W-凸性函数及其应用进行研究。第一章简要介绍了线性
学位
植物病原菌图像处理及其长度测量在农药作用机制的研究中起着重要的作用,为进一步研究植物病原菌图像的智能分析,主要研究工作与成果如下:(1)使用YOLOv4模型对植物病原菌电镜图像进行目标检测。按照病原菌在二分裂时期前后的形态特点分为两类,获取每个病原菌检测框位置,排除外部环境的影响,并通过召回率、m AP等评价指标分析得到较好的检测结果。(2)使用改进Deep Lab V3+图像边缘分割模型完成病原
学位
通过将随机逆特征值问题(简称St IEP)转化为求两个集合交点的可行性问题,我们提出求解St IEP的交替投影算法。我们知道当可行性问题的两个集合都是凸集且解集非空的情形下时,交替投影算法收敛到一个解。然而,与St IEP等价的可行性问题中总存在非凸的集合,所以算法的收敛性分析比较困难,相关的研究成果比较少。注意近来,Lewis等人建立了算法在线性正则条件或黎曼流形假设下,求解非凸可行性问题的交替
学位
同步辐射光束线是一个结构复杂、设备种类繁多的非线性体系。为了满足实验条件,经验丰富的工程师需要通过传统的人工调束模式,一一调整光束线设备上的运动轴在其行程范围内的位置,但整个过程往往费时费力。为了提高光束线运行效率,研究人员采用差分进化算法,依据“适者生存,优胜劣汰”原则,建立了光束线智能优化调束系统,使调束时间由最初的几小时缩短至30分钟之内。该系统要求设备运动轴具有良好的重复性,当加入单色器的
学位
由于同步辐射的X射线纳米探针技术具有高通量、穿透力强、高探测灵敏度和可以开展原位分析等优点,被广泛应用于材料科学、环境科学、生命科学、地质探测、物理化学、天文和考古等众多科研领域中。在纳米探针的X射线纳米聚焦系统中,聚焦光学元件的稳定性对纳米探针的性能有着重要影响,因此对该类光学元件的调节机构提出了高精度和高稳定性要求。由于具备无摩擦、无间隙、运动连续且无需润滑等优点,柔性铰链在国际上被广泛用于硬
学位
在核能领域,精确的核数据是核反应堆物理设计的基础。中子全截面是中子核反应数据库的重要组成部分,是所有核反应截面类型的总和。熔盐堆作为六种第四代核能系统的候选堆型之一,也是唯一一个以液态燃料为核燃料的反应堆。在熔盐堆中,锂因具有熔点低、沸点高、热稳定性好等优点而作为钍基熔盐堆FLi Be熔盐燃料载体盐的主要材料之一。基于SCALE程序对钍增殖熔盐堆不同燃耗时期核数据引起的keff不确定度的分析。结果
学位
软X射线自由电子激光装置(Soft X-ray Free-Electron Laser,SXFEL)已经完成了试验装置的建设,通过国家验收,同时完成了性能升级,正在进行用户装置调试。目前,SXFEL运行在单束团模式,后续将运行在双束团、甚至是多束团模式,因此需要升级当前的微波系统。在高梯度电子直线加速器的组成部件中,能量倍增器是其中一种重要的无源射频腔,它能够将低功率长脉冲压缩为高功率短脉冲,用以
学位
原子核内的团簇结构是原子核物理研究的热点问题,其中α团簇因其自身的稳定性和相对独立性成为团簇研究中的主要方向之一。对于有限核来说,原子核的核子密度小于零温条件下饱和密度的五分之一时,核内会发生四核子配对形成α团簇,团簇之间的弱相互作用导致α团簇态能量处于α粒子发射阈值附近。原子核内的有效核相互作用对核子的结团现象有一定影响,探索α团簇结构的形成机制将会帮助我们了解原子核内部相互作用的基本性质。本文
学位