基于ADMM的神经网络求解算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:dlinc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乘子交替方向法一般被视为机器学习领域中的一种优化算法,起源于20世纪70年代并在机器学习诸多领域中取得了令人瞩目的效果。乘子交替方向法在求解过程中与梯度无关并且对于参数初始化条件鲁棒,这些特性使得乘子交替方向法具有十分广泛的应用前景。随机梯度下降、Adam、RMSProp等优化算法的发展,为深度学习问题的求解带来了一定的便利。但是传统基于梯度的优化算法在训练过程中会收到梯度消失梯度爆炸等问题的影响。尽管乘子交替方向法在机器学习领域中成就斐然,但是其在深度学习中的应用与求解仍然需要进一步的研究。本文主要聚焦乘子交替方向法在求解神经网络中的应用。首先是利用乘子交替方向法求解循环神经网络。针对循环神经网络在求解过程中容易收到梯度消失和爆炸问题的影响,导致训练过程不稳定的问题。而且循环神经网络对于参数初始化较为敏感,较差的参数初始化可能会导致求解效果较差,甚至导致训练结果不收敛。本文从利用乘子交替方向法求解循环神经网络出发,提出了一个针对循环神经网络的新的训练框架:ADMMi RNN。我们分析了求解过程中的参数更新过程,并提出backward-forward的参数更新过程,加速了求解过程的收敛。同时,在MNIST和IMDb两个数据集上比较了ADMMi RNN和一些典型的随机梯度算法的实验结果。实验结果显示ADMMi RNN在MNIST和IMDb两个数据集上可以获得比传统随机梯度算法更好的准确度。我们在MNIST数据集上重复进行10次实验并比较在多次迭代中的方差,在每次实验中参数进行随机初始化,以这种方式探究ADMMi RNN在训练过程中的稳定性。实验结果显示ADMMi RNN具有更好的求解稳定性。本文第二个工作是并行实现了乘子交替方向法求解循环神经网络,并提出一个并行训练框架:P-ADMMi RNN,包括同步并行ADMMi RNN和异步并行ADMMi RNN。同步并行ADMMi RNN和异步并行ADMMi RNN算法实现了较原始ADMMi RNN算法的训练加速。本文最后一个工作针对神经网中非凸损失函数不易求解的问题,提出了一种神经网络非凸损失函数求解算法n-dl ADMM,能求解具有非凸损失函数的神经网络优化问题,可提高分类准确率。
其他文献
机电工程是建筑项目施工建设的重要组成部分,为提升建筑机电工程安装施工技术水平,以机电安装施工技术为主要研究对象,结合以往机电工程安装技术的应用经验,着重从配电装置安装调试、弱电系统安装以及电梯安装三个部分来探讨机电安装施工技术的应用效果。在此基础上,提出构建BIM模型和完善安装施工质量监控制度体系的措施,希望能够为机电工程的安装施工提供一定的优化思路。
期刊
羊群效应是行为金融学理论的重要议题之一。研究表明,受投资者情绪支配的非理性羊群行为有着降低资产定价效率、扭曲资源有效配置的负面影响。羊群效应在全球股市中普遍存在,不仅存在于相对情绪化的个人投资者中,也存在于具有“智钱效应”的机构投资者中。然而,机构投资者被赋予了“稳定市场”和“价格发现”的功能,这与其羊群行为对证券市场产生的影响相悖。声誉羊群效应理论、同业竞争理论等理论模型表明职业焦虑、同辈压力等
学位
随着“工业4.0”和“智能制造”时代的到来,可编程控制系统(PLC)逐渐发展成为军民装备控制领域的主流控制系统,是实现工业装备自动化、信息化、智能化的重要载体,基于IEC 61131国际标准和PLCopen规范的运动控制软件设计也已成为当前CNC机床、机器人、自动化生产线等制造装备应用软件的主要开发手段。当前,我国工业装备制造发展水平与世界先进技术还存在较大差距,高端工控系统大都依赖于外商,产品技
学位
科技创新是时代发展的主推力,优秀的知识经济能够促进企业创新产出,也能促进企业转型升级并不断稳固自身市场份额,因此市场经济的主体——公司不仅不能固步自封,还需要依靠源源不断的人才经济来进行科技创新活动。随着国家政策对中小型企业地青睐,中小企业每年的研发开支呈良好上升趋势,即使相较于国外研发开支水平来说依旧处于低水平,因此如何更高效地提高创新产出效率是企业当下思考的问题。公司进行创新活动中需要面对一系
学位
近些年,在市场的需求下,建筑工程领域的发展速度非常的迅猛,随着各种先进技术的不断出现,房屋建筑的使用功能也在不断的增加。房屋建筑的这些功能的实现,需要依托于建筑机电安装工程来完成,建筑机电安装工程是房屋建筑中不可缺少的重要工程,这项工程的开展效果,会直接影响到房屋建筑的使用效果。建筑机电安装工程具有很强的专业性,在项目的开展过程中,涉及到了大量的施工技术,这些施工技术如果不能得到有效的落实,就会直
期刊
城市社区党建是基层党建的重要组成部分,是党组织建设伟大工程在基层的鲜明体现。面对党建引领城市社区治理这个复合命题,目前主要有两个方向的研究维度。一是对党组织本身的概念内涵、功能定位等理论性研究,二是对党组织引领城市社区治理中存在的问题、如何提升治理能力等实践性研究,这两种逻辑思路的整合,是本文研究的重点,也是未来城市社区党建融合发展的方向。城市社区党建作为理论与实践的成果,其背后有着丰厚的思想渊源
学位
技术的发展决定着新闻信息传播的速度、范围,以及新闻事件与人之间的关联,进而决定着媒介的时间和空间以及新闻的相关性。基于媒介本体论的视角,依托基础设施在人与物、不同的时间和空间所建立起的多重关系网络,来分析数字技术条件下新闻价值的变迁:首先,基础设施连接着不同的地理空间并决定着新闻的传播速度,由此能够影响新闻的时效性,以及由于不同传播速度所导致的时间和空间关系的变迁;其次,基础设施通过算法将不同的新
期刊
高等教育管理体系的优化与创新是高等教育管理工作的核心内容,基于人本化理念强化柔性管理,促进柔性管理与刚性管理有机融合,既能提升学校教育质量,又能为学校发展提供多元化建设性意见。从人本化理念在高等教育管理体系中的价值体现入手,深入剖析高等教育管理的问题成因,提出优化高等教育管理体系的思路,即借助坚守人文化理念,营造良好管理环境;完善人性化制度,创新教育管理过程;尊重多元化个体,展开多元有效评价。
期刊
21世纪以来,随着复杂网络相关研究的兴起,现实世界中众多系统的复杂网络特性和现象被人们所发现,其中之一就是复杂网络中的级联失效。作为互联网基础的域间路由系统具有典型的复杂网络特性,由于由来已久的路由协议缺陷,面临的级联失效威胁尤为严峻。本文在对复杂网络级联失效效应仿真分析的基础上,深入研究了域间路由系统级联失效的影响因素和内在机理,构建了基于最优有效路径的域间路由系统级联失效模型,研究了策略选择对
学位
垂直起降可重复使用运载火箭可提高发射密度,满足快速响应发射任务的需求,极大降低航天器发射任务的成本,具有很强的应用前景。本文考虑返回轨迹存在的多飞行段、多约束、强非线性、强耦合、参数不确定和外部干扰等问题,研究了返回轨迹的自适应优化方法,开展了不确定性条件下的分析与优化方法研究,形成了从确定性到不确定性返回轨迹分析与优化方法的系统研究。论文的主要研究内容如下:提出了基于聚类分析的返回多飞行段轨迹自
学位