深度神经网络的归一化技术研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:hou189
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年随着深度学习和神经网络的快速发展,归一化技术的研究在深度神经网络中已经是必不可少的一部分。批归一化技术(Batch Normalization,BN)通过计算小批量中的示例的均值和方差来对输入进行归一化从而减轻深度神经网络训练中的梯度爆炸和消失的问题;权重归一化(Weight Normalization,WN)通过对训练参数进行解耦合从而改善优化问题来加速收敛;层归一化(Layer Normalization,LN)计算单个训练样本的所有单元的均值和方差来对输入进行归一化。归一化技术的提出促进了深度网络的发展,为此,本文基于深度学习网络开展了以下三个方面的归一化技术研究:(1)研究了典型的几种归一化技术在多层前馈网络和卷积神经网络(Convolutional Neural Network,CNN)中的应用及其效果,给出了包括批归一化、层归一化、分组归一化(Group Normalization,GN)、权重归一化在内的各种归一化算法复杂度和性能对比。观察了采用批归一化算法后每层网络的参数尤其是其两个可训练参数增益和偏置变化情况,并且基于观察到的现象提出了优化后的批归一化算法CBN(Convenient Batch Normalization),优化后的算法CBN在保持同样分类准确率的情况下降低了标准批归一化算法的复杂度,经实验验证,在101层的ResNet网络上应用优化的归一化算法可减少约15%的训练时间。(2)针对小批次输入的归一化问题,提出了一种通过修正的移动均值和方差来得到更准确的参数估计的归一化算法。该修正算法基于批重归一化(Batch ReNormalization,BRN)算法,重点对BRN算法中的梯度更新和归一化操作根据批次大小进行了调整。实验表明:改进后的归一化算法在小批次输入下收敛更快,性能更佳。(3)针对长短期记忆网络(LSTM,Long Short-Term Memory),对比研究了各种归一化算法,分析了归一化算法在CNN网络和RNN网络中的差异性。论文在分析的基础上重点在两个仿真任务(自编码器及自然语言分析)上进行了实验。实验结果表明:适合CNN的归一化算法不一定对LSTM适用,Weight Normalization不管是从计算量还是时间成本来说都比较适合用于LSTM任务,但是如果对计算量没有要求,引入了平滑系数的Layer Normalization和L1正则化结合可能是目前最好的选择。
其他文献
近些年来风电在世界范围内得到了飞速的发展,已经成为我国第三大发电来源。风电机组作为风电场最关键的设备,常工作在气候多变、环境恶劣的自然条件下,高达20%-35%的运行和维护成本严重影响着风电场的经济效益,制约着风电行业的发展。数据采集与监视控制(Supervisory control and data acquisition,SCADA)系统是风电机组常用的运行状态监测系统,但SCADA数据易受自
目的评价64层螺旋CT多向调整多平面重组(MPR)技术在长骨病变诊断中的应用价值。资料与方法搜集我院2006年1月~2010年3月间,经病理(手术或穿刺活检)证实的发生于四肢长骨的骨
介绍了纺织领域中生物基浆料的发展现状,举例阐述了传统和新型生物基浆料的主要性能、特点,并对生物基纺织浆料的发展前景做出了分析与展望。
目的利用双源CT(DSCT)观察心肌桥-壁冠状动脉(MB-MCA)的检出率及解剖学特征,研究DSCT对MB-MCA的诊断价值;探讨壁冠状动脉(MCA)收缩期的狭窄程度与心肌桥(MB)的长度及厚度间的
捕后羁押率偏高、捕后羁押缺乏救济是我国长期以来的羁押现状,修改后刑事诉讼法实行的羁押必要性审查制度对逮捕与羁押适度分离进行了初步探索,对完善我国羁押制度、保障被告
随着小学生学习压力的日益加重,小学生开始过早的呈现出各式各样的生理及心理问题,比如失眠、烦躁、抑郁以及考试焦虑等,这些由于学习压力所引发的问题在小学生群体中非常普遍,已经给广大小学生造成了严重的心理负担和精神压力,因此小学生的学习压力问题如果不能得到有效缓解,这一问题会直接影响到小学生的身心的健康发展。本文采用音乐治疗方案来重点解决小学生由于学习压力而产生的心理问题,通过音乐风格形态走入小学生内心
现代信息技术飞速发展,网络媒体应运而生,为了引导网络舆论方向,需要坚定马克思主义立场。本文将具体探讨以马克思主义新闻观引导网络舆论的必要性及路径,以期为有识之士提供
目的探讨千里光提取物对急性过敏性结膜炎模型大鼠的抗炎作用及其机制。方法将SD雄性大鼠随机分为正常组,模型组,阳性药物组,千里光低剂量(2.65 g·kg-1)、高剂量(10.60 g·k
8月29日下午,2012北京国际图书博览会作家交流区内,来自全国各地的专家、学者、少儿出版人会聚一堂,为中国当代儿童文学畅销书作家曹文轩作品走出去庆功。在这场江苏少年儿童出
报纸
<正>一、案情简介陶某原系某市铸造厂的职工,于1989年3月进入该铸造厂从事清砂等粉尘作业,7年后发现肺部不适,2010年12月2日经某市疾病预防控制中心诊断为铸工尘肺壹期。2002