面向大规模数据集的随机最优化方法关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:lm403379799
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习作为人工智能技术的核心支撑受到了广泛的关注。数据规模不断增长,对最优化方法求解机器学习模型带来了新的挑战。本文以提高随机最优化方法在大数据条件下的收敛速度和精度为目标,针对随机梯度降噪算法计算效率低、自适应梯度方法泛化能力低、随机拟牛顿方法收敛速度慢、基于随机梯度下降的Lookahead方法调参要求高等问题,从随机梯度下降算法的弹性降噪、自适应梯度方法的边界调度、随机拟牛顿方法的降噪加速、Lookahead方法的学习速率调度等方面展开研究。论文研究的主要内容包括以下几个方面:传统随机梯度降噪方法的实现需要维护一个辅助信息,处理大规模数据集时存在两个问题:(1)存储或计算开销过大;(2)导致频繁的磁盘IO。针对该问题,本文提出了一种基于数据子集和历史梯度信息的弹性降噪方法FVR-SGD,能够降低传统降噪方法的额外开销,提高内存效率。FVR-SGD算法在实现降噪时不需要计算或存储全梯度信息,而是基于每个迭代周期的历史梯度信息实现降噪。在每个迭代周期FVR-SGD算法无需处理整个数据集,而是可以根据内存的大小灵活的将数据集分割成多个子集,每个迭代周期只需要处理一个子集,从而降低了磁盘IO,提高计算效率。在基于历史信息和部分数据实现降噪的同时,我们仍然证明了FVR-SGD算法具有线性收敛速度,并给出了收敛的具体条件。实验表明,与传统降噪方法相比,FVR-SGD算法可以降低计算开销并弹性适应内存,还能提高模型收敛速度,在处理大规模数据或复杂参数模型时更具优势。自适应梯度方法在训练复杂神经网络模型时存在收敛精度低、泛化能力弱等问题,本文基于自适应梯度提出了边界调度算法Bsadam,能够通过对自适应梯度进行限制和调度来提高收敛精度和泛化能力。Bsadam算法分析了可能导致自适应梯度方法泛化能力降低的各种因素,并针对这些因素提出了优化方案。为了避免极端学习速率对自适应梯度方法的收敛造成不良影响,Bsadam算法为自适应梯度方法的学习速率设置了一个合理的边界,从而保证算的收敛性能。为了提高自适应梯度方法的收敛精度和泛化能力,Bsadam算法根据自适应梯度方法在迭代过程中每个阶段的不同需求对边界进行调度。Bsadam算法首先通过不断提高学习速率下界来使自适应梯度方法寻找更好的极小值,然后再使学习速率上界不断下降来保证算法的收敛性能。实验表明,Bsadam算法在保持自适应梯度方法较快收敛速度的同时,还能提高自适应梯度方法的收敛精度,使自适应梯度方法具备更好的泛化能力。随机拟牛顿方法存在构建向量序列不稳定、算法收敛速度慢等问题,本文提出了一种基于多种降噪方法的随机拟牛顿加速方法,可以提高拟牛顿方法在随机迭代过程中梯度估计的准确性,有效提高构建向量序列的稳定性。随机拟牛顿方法由于相邻的两次迭代使用不同的数据来进行梯度估计,可能导致相邻两次计算得到的梯度存在较大的差异,从而使基于两次梯度差和权重差得到的向量序列出现抖动,进而导致算法更新方向出现偏差。本文提出了一个能够结合使用多种降噪方法的随机拟牛顿算法框架,在这个框架内随机拟牛顿算法可以使用SVRG、SAGA、SAG等多种降噪方法,使得算法在迭代时即使使用不同的数据进行梯度估计,也不会出现大的抖动,从而保证了更新方向的稳定。本文还进一步提出了一个无需额外计算和存储开销的轻量降噪方法,使算法在处理大规模数据集时更加高效。实验表明,基于降噪的随机拟牛顿加速方法能够在大数据集上取得明显的加速效果。基于随机梯度下降的Lookahead方法存在需要手工调参,收敛速度慢等问题,本文提出了一种基于学习速率调度的Lookahead加速方法,可以避免手工调参并能够提高收敛速度。使用学习速率调度只需要明确一个合理的学习速率区间,而不必寻找最优的学习速率,可以避免额外的调参开销。学习速率调度有循环调度和单周期调度两种方案。循环调度将整个迭代过程分为多个循环周期,每个循环周期内使学习速率由高至低变化,使Lookahead算法在每个循环周期内都具备越过局部极小值,收敛到附近最优解的能力,通过多个循环周期的训练最终使算法找到一个较好的极小值点。单周期调度将迭代过程分为两个阶段,第一个阶段使学习速率由低至高变化,是Lookahead算法能够更快的越过局部最优解,寻找更合适的全局最优解,第二个阶段通过不断降低学习速率使算法能够收敛的找到的全局最优解。实验表明,基于学习速率调度的Lookahead加速方法在收敛速度和收敛精度方面都得到了提升。
其他文献
在进入智能化社会和物联网普及的今天,传统冯·诺依曼体系结构在存储墙问题和功耗问题的制约下已无法满足高性能低功耗计算的需求。为弥补传统冯·诺依曼体系结构的不足,研究人员提出了存储计算融合的新模式,其中包括类神经计算和逻辑计算。忆阻器的出现使存储计算融合的可行性进一步提高,基于忆阻器的存储计算融合被广泛研究。忆阻脉冲神经网络作为基于忆阻器的类神经计算的一种模式,具有类生物性和超低功耗的优势,是目前的研
无源定位跟踪技术利用截获的辐射源发射的信号来确定该辐射源的位置和速度,自身不需要发射电磁信号,具有良好的隐蔽性,能提升探测系统在复杂电子战环境下的生存能力,是近年来探测、侦察技术研究的热点之一。在各种无源定位跟踪体制中,基于测向的无源定位跟踪技术利用辐射源来波到达角实现对辐射源的定位跟踪,在单站及多站组网观测场景中具有广泛应用。但是,在超视距观测和异步观测多目标跟踪场景,传统的测向定位跟踪技术面临
随着我国装备服役年限的增长和实战化运用水平的提高,间歇故障出现的频率越来越高,日益成为影响装备服役安全和任务成功的重要因素。由于间歇故障瞬变、随机、持续时间极短等特性,检测与诊断定位难度极大。论文在基础加强计划重点基础研究项目资助下,针对电子设备的主要间歇故障类型—板内连接型间歇故障,深入分析其间歇故障机理,开展间歇故障的检测与诊断技术研究。论文的主要研究内容包括:(1)板内连接型间歇故障机理针对
近些年来,由于深度神经网络(尤其是卷积神经网络,CNN)的发展,全世界见证了各类计算机视觉任务的成功,例如图像分类、目标检测以及视频分割等等。但是,随着视觉任务的日益发展,所需的模型结构愈来愈复杂,这给训练设备带来了沉重的存储负担。在实际应用中不可能将这些大型高性能模型直接嵌入资源受限的平台中,这将鼓励卷积神经网络模型朝着具有较小的内存和计算成本的方向发展,以便在不影响任务性能的情况下进行快速推断
高超声速滑翔式飞行器结合了飞航导弹和弹道导弹的技术优点,其高升阻比气动外形使它在滑翔飞行段具备大范围机动能力。在不断发展的防御武器威胁下,需要开展高超声速滑翔式飞行器机动突防相关研究。再入滑翔阶段是面临防御武器威胁的主要阶段,也是区别于弹道式武器突防的主要阶段。本文主要从高超声速滑翔式飞行器在再入滑翔段面向突防的轨迹规划、制导方法以及机动突防方法三个方面开展研究。主要研究内容和研究结果如下:1.研
近年来,深度学习算法已经成为机器学习领域应用的主流模型,其中,卷积神经网络和循环神经网络在图像、视频、声音、文本等各种数据对象的智能分类、检测、识别应用中效果尤其突出,已经成为最主要的两类深度神经网络模型。随着精确感知和高精度识别任务需求的不断增长,大量智能应用在采用这两类深度网络模型时均使用层数更深的结构,需要高算力专用硬件的支持,这两大类深度学习网络的加速技术一直是研究的热点问题。同时,针对不
通信技术和传感器技术的发展让智能移动终端拥有越来越强大的计算、感知、存储和通信能力,随着这些智能移动终端设备的爆炸式普及,移动群智感知(Mobile Crowdsensing,MCS)作为一种新兴的感知模式应运而生,它将众包思想与移动感知相结合,通过大量智能移动终端的不断移动和广泛参与完成大规模复杂感知。与传统的传感器网络相比,MCS具有部署成本更低、系统构建更加快捷、维护更容易、更具有可扩展性、
装备技术体系是武器装备体系在技术视角下的延伸,是装备技术整体规划的重要理论基础。装备技术体系的理论研究必须以钱学森的系统科学思想为指导,对装备技术体系的战略探讨、生成方法、结构建模、体系评估以及发展预测等方面进行研究。现有研究的主要问题包括:第一,虽然以德尔菲为代表的专家法取得了广泛的应用,但存在论证周期长、成本高、覆盖不全等缺陷;第二,虽然多视图体系结构框架设计了完备的视图产品和元模型,却没有给
同步定位与建图(Simultaneous Localization and Mapping,SLAM)是指机器人在未知环境中移动时利用所搭载传感器的观测数据进行场景地图构建,并同时估计机器人在地图中的位置及运动轨迹。随着低成本三维视觉传感器(RGB-D相机)技术的成熟,三维视觉SLAM技术成为机器人领域和计算机三维视觉领域中新的研究方向。本文以实际应用需求为牵引,利用RGB-D相机可同时采集彩色图
随着大数据和硬件计算资源的发展,人工智能当前进入了深度学习时代,深度学习时代具有两个最为显著的特点:一是计算量大,二是在多个应用领域效果远超传统方法。传统的人工智能方法虽然计算量相对较少,但是其性能遇到了天花板,很难进一步提高,而目前来看深度学习只要数据量足够,通过合理的网络设计以及足够的计算其在性能上往往都具有非常高的潜力。为了获得足够的深度学习计算加速,当前展开了各种硬件竞赛,比如GPU上针对