深度卷积神经网络的若干优化方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:yanmu1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度卷积神经网络模型可以从优化的角度进行研究,设计合理的模型和求解算法是优化问题的关键。本文主要从数据筛选方式和网络结构设计两方面尝试对深度卷积神经网络方法进行优化。针对数据筛选的优化方式,主要考虑了基于梯度和基于主动增量学习两种方案。梯度筛选优化方案主要侧重于算法层面,通过预训练模型在每个数据上反传回的梯度量级来衡量数据的重要程度。主动增量学习侧重从模型预测结果方面设计筛选标准,通过熵来评估候选样本的准确性,通过散度信息评估样本的稳定性,再将两者加权组合得到最终的筛选指标。实验证明,基于梯度的筛选方案不仅能够获得稳定的提高模型性能,还能够发现数据中的冗余现象。另一方面,本文发现主动筛选方案相比随机筛选能够在使用一半数据量的情况下取得相当的训练效果。针对网络结构的优化,主要考虑了在分类问题中添加跳层连接的多路径结构和语义分割问题中的多尺度损失函数结构。从实验结果上看跳层连接结构类似于模型的集成学习方案,通过多个长短不同的小网络路径(弱分类器)集成得到一个性能更好的大网络(强分类器)。这种多路径的分析方法为梯度的相关性分析提供了依据,在假设网络的每一层满足激活神经元占总神经元半数的情况下,证明了加入了批量正则化的残差网络可以使得层间的梯度相关性由指数衰减变成了亚线性衰减,这对网络整体结构的稳定是有益的。考虑到深度网络不同层通常会学习不同的特征,本文提出了多尺度损失函数的概念,在每个尺度对特征提取的效果进行评估。同时对比说明了这种深度多尺度方案与基于马尔可夫随机场的序列最大后验模型的分割思想类似。另一方面,结合最新的深度学习理论研究方法,发现多重网络中的V-cycle模式与语义分割的Unet方案在结构上很相似,本文详细对比了V-cycle和简化的Unet结构。深度学习的理论解释尚不完善,大部分深度学习结构需要在大量的人工调参才能取得好的效果,本文的工作为从理论方面解释深度学习提供了一些思路。
其他文献
为解决温州龙湾污水管网系统建设不完善导致含铁酸洗进入河道污染河道水体的问题,本文研究了浮水植物对含铁污染河水的净化效果,考察了初始Fe2+浓度、生物量、初始pH等对浮水植物净化效果的影响,探讨了浮水植物净化含铁污染河水的机制。主要结论如下:1、六种浮水植物对Fe2+浓度为5.0 mg/L的铁污染水体中亚铁(Fe2+)与全铁均具有较好的去除效果。粉绿狐尾藻(Myriophyllum verticil
随着全球现代化、工业化的深入,对能源的需求日益加剧,能源问题依旧是当今世界密切关注的重大问题。作为一种遵循能源梯级利用原则并且可同时向用户提供冷热电负荷的分布式冷
本文以潮间带和内陆生境盐地碱蓬为实验材料,对其在野外和实验室盐分可控条件下植株收获的二型性种子发育过程对盐渍环境的响应做了初步探究,期望为理解盐生植物对盐渍环境的适
【摘 要】 目的:运用现代信息技术在《病原生物与免疫学基础》教学中的应用,有利于培养学生的自主学习能力,优化教学过程,提高课堂效率。方法:在教学中运用多媒体课件、动画、微课和网络课程等多种辅助手段来提高教学质量。结果:现代教育技术在教学中的应用弥补了传统教学手段的不足,同时对加速教学手段的现代化、促进教育教学改革和打造高效的教学效率。结论:现代教育技术给教育教学领域带来了新的生机与活力,增强了学生
烟草助长剂松葳Ⅰ对蚜虫、赤星病有很好的防效,试验表明:各处理烟株生长正常,长势一致;处理区的气候斑和蚜虫低于对照区。松葳Ⅰ有较强的杀虫灭菌功能,但是防效与用量并不成正比关
目的探讨大脑状态指数监测(Cerebral State Index,CSI)与肺部感染评分(Clinical Pulmonary Infection Score,CPIS)对脑外伤昏迷合并肺部感染患者的预后判断价值。方法选择都江堰
表面等离激元(Surface Plasmons,简称SPs),是一种电子气集体振荡[1]-[15]。由于隐场的特点,空间域的光场衍射极限被SPs打破,并出现局部增强效应。这些特性使SPs广泛用于敏感传