深度学习中优化算法的研究与改进

来源 :北京邮电大学 | 被引量 : 93次 | 上传用户:ilqiqi2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习是一种最近提出来的机器学习模型。该模型与传统的浅层机器学习模型相比,含有两层及两层以上的隐藏层。实际上,深度学习是一个多层次的网络结构,该网络结构可以用一个复杂的复合函数进行拟合。深度学习中的复合函数的自变量是深度学习模型每一层中的权重参数及偏差项,这些参数的取值直接决定了网络输出的准确性。为了提高深度学习模型输出值的准确性,我们需要不断优化该模型中的参数,因此,深度学习中的优化算法已经成为人们的研究热点。本文针对深度学习中五种典型的优化算法进行改进,包括:Adam算法、RMSProp算法、AdaGrad算法、动量算法以及梯度法。为了使Adam算法和AdaGrad算法有更快的收敛速度,我们在Adam算法和AdaGrad算法中引入了动量的思想,提出了带动量的Adam算法和Adarad算法,我们称改进的Adam算法为AMM算法;为了修正动量算法中的初始化误差,我们提出了改进的动量算法;为了避免给RMSProp算法设定初始学习率的困扰,我们将两种典型的BB步长引入到RMSProp算法中,提出了带BB步长的RMSProp算法;为了克服梯度法在最小值点附近收敛速度变慢的缺陷,我们将典型的模式步引入到梯度法中,提出了带模式步的梯度法。我们通过数值实验表明了五种改进之后的算法在不同程度上优于原来的算法,其中Adam算法的改进效果最为明显,我们不但给出了 AMM算法的数值实验,我们通过理论分析证明了该算法的收敛性。目前还没有其他四种算法的收敛性证明。除此之外,带模式步的梯度法还没有应用到深度学习模型中。我们将在以后的工作中对除AMM外的四种算法进行理论分析。
其他文献
建立可追溯体系是破解电子商务产品质量问题的关键。本文给出电子商务交易产品可追溯的功能及涵义,通过分析各参与方在电商产品交易中的追溯功能,提出一种基于电子商务交易参
今年一月二十五日,中国戏剧家协会上海分会请宗福先、孙毅、蒋星煜等同志传达了中国作家第四次代表大会的精神和党中央负责同志在会上的讲话。到会的戏剧工作者受到极大的鼓
炎热的夏季,各类新鲜蔬菜走俏市场。在超市等卖场以绿色、健康著称的有机蔬菜更是“独树一帜”,博得很多白领消费者的追捧。但是,一位不愿意透露姓名的农业专家揭示:其实,太原市面
<正> 当前物理教学正面临改革的形势,很多教师都从实验教学抓起,取得了很好的经验,但也出现不少值得探讨的问题。例如,过去我国中学物理课本上的学生实验多半是验证性的实验,
<正>1培训内容(一)透过国际三大音乐教学法的教育理念和教学方法,以小学三年级、四年级的教学内容为基础,从每个单元中精选一节教学课例,进行教法融合的全体系培训。(二)提供
目的:探讨以端粒为靶点的氧化损伤标志物的筛选,进而可能可以用来临床上早期发现或预报氧化损伤。方法:采用端粒重复序列结合因子2(TRF2)基因敲除(TRF2-/-)斑马鱼胚胎作为氧化损伤
快节奏的生活促使着人们改变了传统的生活方式,人们越来越不愿在厨房里花费过多的时间和精力。新一代的消费群体在不断壮大,这使得方便类食品越来越受到大家的喜爱。最新调查
采用有限单元法对不同筏板刚度下桩筏基础下卧层附加应力的分布规律进行分析.计算结果表明,筏板刚度对桩顶反力、桩端阻力和下卧层附加应力分布的不均匀性有很大影响,且在刚
2012年4月11日,山西省质监系统认证认可工作会议在太原召开,山西省质监局党组书记、局长常高才出席并作重要讲话,党组成员、纪检组长张亥生作了工作报告。各市质监局,太原高
随着我国经济的不断发展,我国大部分淡水资源的水质出现了恶化的趋势,逐渐无法满足人们的正常生活所需。因此为了改善水质,为人们提供水质符合要求的生活饮用水,净水机便进入