【摘 要】
:
近年来,深度学习作为一种新兴的信息技术广泛应用于各个领域。在某种确定的深度学习模型下,神经元连接处的参数大小决定了模型优劣,为了提高模型的准确性,在训练过程中需要对参数取值进行优化,其中涉及到的优化问题主要是对经验风险函数进行最小化求解。随着数据规模的不断扩大,传统的一阶优化算法已经不能有效解决经验风险最小化问题。随机算法是指在迭代的过程中随机选择一个或部分样本的损失函数梯度近似损失函数全梯度,以
论文部分内容阅读
近年来,深度学习作为一种新兴的信息技术广泛应用于各个领域。在某种确定的深度学习模型下,神经元连接处的参数大小决定了模型优劣,为了提高模型的准确性,在训练过程中需要对参数取值进行优化,其中涉及到的优化问题主要是对经验风险函数进行最小化求解。随着数据规模的不断扩大,传统的一阶优化算法已经不能有效解决经验风险最小化问题。随机算法是指在迭代的过程中随机选择一个或部分样本的损失函数梯度近似损失函数全梯度,以达到降低梯度计算量的目的。目前,随机算法已成为深度学习中优化问题研究的焦点,所以设计一种更加快速高效的优化算法是有必要的。本文的主要工作有:(1)本文首先介绍了两类一阶随机优化算法的思想和原理,探讨了不同算法之间的区别与联系。第一类为随机梯度下降算法及其改进算法,改进策略大致分为动量加速、方差缩减和自适应学习率三种。其中,前两种主要是校正搜索方向或梯度估计,第三种是对参数变量的不同分量自适应地设计步长。第二类为随机共轭梯度类算法。(2)本文以经典优化算法中常用的共轭梯度算法为基础,为了减少对梯度的计算量,我们对已有的随机共轭梯度算法进行改进,提出了一种新的方差缩减的随机共轭梯度下降算法(SCGA),并通过理论证明和数值实验说明了新算法SCGA在求解经验风险最小化问题上的有效性。(3)我们考虑三项共轭梯度算法的优点,提出一类随机三项共轭梯度算法,并将这类算法与随机梯度类算法和已有的随机共轭梯度算法进行实验对比,数值结果表明新算法在收敛速率上快于随机梯度类算法,并且和已有随机共轭梯度算法表现相当。
其他文献
近二十年来,中国的软件产业蓬勃发展,并在国民经济中占据着越来越重要的地位。但是由于软件项目的多变性及不可控性,导致软件项目的成功率无法保证。这就导致了软件项目经常会出现产品延期交付的情况,甚至有的项目在中途就会被取消。针对这个现象,人们设计了许多软件开发模型来提高项目的成功率。其中,瀑布开发模型由于其自身的易操作性和易理解性,使其在很多大型软件开发项目中被采用。但是由于瀑布模型本身存在的缺点,导致
随着科技的发展,医疗领域逐渐走向智能化,越来越多的研究人员开始医疗图像研究。医疗图像的研究离不开医疗图像数据集的构建,所以医疗图像标注系统的研究与开发应运而生,然而,医疗图像的特异性对医疗图像标注系统提出了更高的要求,如何利用医疗图像的特点,设计合理的标注方法,成为标注系统设计的一大挑战。本文针对医疗图像具有特异性的特点,设计并开发了多模态医疗图像标注系统。其针对医疗图像多模态的特点,设计了多种标
随着科学技术的发展以及人们需求的增加,拥有丰富资源的海洋倍受关注。海面的三维可视化一直是计算机图形学研究的热点和难点之一。海浪的模拟和可视化可用在军事、影视以及虚拟现实等领域。由于研究水平的不断提升,对海洋的模拟要求也更高,不仅需要提升模拟的真实感,还需要保证模拟的效率。现阶段对海洋的模拟无法兼顾真实感和实时性。本文基于此背景对高真实感海面进行研究和仿真。本论文的主要研究内容以及创新性成果如下:1
光探测器作为光通信系统中的关键器件,其高速性能的优化对整个光通信系统未来发展有着至关重要的作用。单行载流子光探测器(Uni-Traveling-Carrier Photodector,UTC-PD)中电子作为单行载流子进行输运,极大减少了载流子的渡越时间并有效抑制了空间电荷效应,是高速光电子器件领域的研究热点之一。本文从UTC光探测器的入射光束光场分布以及器件吸收层横向高斯掺杂入手,重点围绕光探测
大气激光通信利用激光承载信息,具有带宽高、容量大、成本低、抗电磁干扰能力强等优点,是光通信领域的研究热点之一。实际的大气信道存在大气衰减、大气湍流效应,会对信号传输造成强烈干扰,而对抗湍流干扰最基本的方法就是采用高能效比的调制编码技术。PPM作为一种高能效比的调制方式,在大气激光通信中展现出显著优势,但其在传输过程中容易出现符号串扰、时钟失步等问题。因此,研究稳定高效的PPM调制解调技术对其在大气
硅(Si)基光电子技术可以将光子技术的高带宽、低功耗、高速率优点和微电子成熟的加工技术相结合实现光电集成,它具有低成本、高集成度、高可靠性的优势。目前,Si基光电探测器、Si基光调制器以及Si基光波导方面都已经成功得到广泛的应用,但是Si基激光器还有不足之处。尽管已有基于晶片键合技术的Si基光电集成的商用芯片,然而晶片键合技术存在着成本高、无法大规模生产等问题。Si基直接外延Ⅲ-Ⅴ族半导体材料技术
近年来,随着互联网、移动互联网的发展,通信等基础设施的不断完善,传统的教育机构和新兴的互联网企业都在尝试探索在线教育的最佳模式,教育逐渐从线下走向线上,在线教育行业受到大数据的影响。传统的数据分析系统已经不能满足教育大数据环境下的分析场景,特别是从海量用户数据中预测未来教育行业的发展趋势。目前国内外在线教育平台都在打造自己的数据分析系统,本论文以某在线教育平台为基础,搭建综合数据分析系统,使之能够
随着移动互联网技术的飞速发展,公众可以通过网络随意针对社会热点事件进行转发和点评,从而导致网络舆情事件爆发。近年来,舆情事件信息的主体逐渐由文本数据转变为视听化程度更高的音视频数据,由于音视频数据存在时长差异且极有可能出现超长时的情况,针对这类音频数据无法直接进行识别分析,同时现有的语音识别系统未融合舆情领域知识和音频情感因素,无法针对音视频数据进行有效的舆情研判。针对以上问题,本文设计并实现了基
随着5G、云计算等新兴技术的不断涌现,越来越多的复杂功能被加入到传统IP架构网络中。这在一定程度上导致了交换设备日渐臃肿、存储空间较为紧缺、网络拥堵现象逐渐增多,难以满足日益增长的高性能网络需求。软件定义网络(Software Defined Network,SDN)被认为是解决IP网络架构僵化、提高资源利用率并促进未来网络创新的有效途径之一。SDN网络将控制平面与数据平面解耦合,控制平面负责集中
加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题,定理证明作为人工智能领域的核心研究课题在一定程度上影响着人工智能技术的发展。随着一些交互式定理证明辅助工具Coq、Isabelle、HOLLight等的诞生,定理机器证明的研究有了更进一步的发展。Coq是国际上广泛使用的一个交互式定理证明工具,它基于归纳构造演算,有着强大的数学模型和良好的扩展性,更为重要的是,基于C