基于自适应演化的神经网络参数和架构搜索研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:yanqingkuiyan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
神经网络在人工智能领域取得了巨大的成功,并且被应用于语音识别,图像识别和自然语言处理等领域。其中,神经网络的性能好坏是由其参数和结构决定的,本文针对以上两个方面展开研究:神经网络的参数搜索和神经网络的结构搜索。首先,反向传播是人工神经网络中应用最广泛的参数搜索技术之一,并且在多种深度学习方法中都得到了广泛应用。然而,采用反向传播技术的神经网络依赖于梯度下降策略,容易陷入局部最优。其次,卷积神经网络(CNNs)的架构大多是通过人为手工进行调节设计,这样就要求设计者需要丰富的专家知识,并且已有架构搜索方法不能很好保留搜索过程中的经验,除此以外,完整评估每一个搜索到的架构十分消耗资源,并且最终搜索到的模型的尺寸也是影响到算法实用性的一大关键问题。针对以上几个问题,本文开展以下研究:(1)针对反向传播算法易陷入局部最优的问题,并且其效果极大的受到梯度下降策略中超参数选择的影响,本文提出一种基于种群的自适应梯度下降搜索算法来搜索神经网络的参数。该算法自动设计不同阶段的学习率来匹配不同的搜索阶段并将其分别加入策略池,无需人为调参优化效果,并且提出的算法还结合了演化计算的种群优势,增加算法在巨大搜索空间中的勘探能力,从而使算法有更好的全局搜索能力避免陷入局部最优。(2)针对已有架构搜索过程中搜索策略单一以及演化信息丢失的问题,本文提出一种基于块的自适应的变异策略的遗传算法来进行神经网络架构搜索,提出了三种架构变异算子,并使用自适应机制根据初期经验指导后续演化,丰富搜索过程中的种群多样性的同时,加大搜索到最终新型架构的概率。(3)针对搜索过程中每次个体评估时间过长的问题,本文压缩了搜索空间,并提出一种渐进式切割块的方式,在保证精度的前提下,减少参数量,压缩模型大小,从而加快评估速度和减少计算资源的消耗。
其他文献
事业单位工资制度经历了多次改革,历次改革均有其特殊的背景及意义。文章分析目前事业单位特点,结合工作单位中的实际问题,分析指出绩效工资制度改革的重点难点及对策。
事业单位是我国公共服务活动中的重要实施者和组织者,并且涉及的领域也十分广泛,对社会的健康发展起着很好的推动性作用,因此,推进事业单位改革有着重要的价值和意义。在事业单位改革过程中,绩效工资制度的改革是关键内容。但是,目前我国事业单位的绩效工资制度改革过程中仍然存在着一些不足和问题,对事业单位绩效工资制度改革完善产生了很大的消极影响。为了更好地推动事业单位改革创新发展,需要对事业单位绩效工资制度进行
以宁波至奉化城际铁路工程为例,通过Midas Civil软件建立三维分析模型,按《城市轨道交通结构抗震设计规范》相关条文要求对车站结构在多遇、罕遇地震作用下的抗震性能进行分析,为基于轨道交通相关规范的横向双柱高架车站抗震性能研究提供了可供参考的分析全过程。
<正>党的二十大提出,要“深入实施创新驱动发展战略,开辟发展新领域新赛道,不断塑造发展新动能新优势。”元宇宙作为虚拟世界与现实社会交互的重要载体,是新一代信息技术重大前沿领域,对云南省领跑产业发展新赛道、重塑竞争新优势具有重要意义。元宇宙以区块链技术为底层技术,辅以人工智能、大数据、云计算等技术,支撑不同的应用场景,能够实现全面数字产业化、产业数字化。近期,
期刊
电子回旋共振(Electron Cyclotron Resonance,ECR)离子源是为现代重离子加速器提供强流高电荷态离子束的最常用装置。随着加速器对离子束流强度需求的逐渐提升,更高流强的离子束的空间电荷效应将会对束流在低能段的传输及束流品质产生更为严重的影响;另外,强流高电荷态ECR离子源引出区的复杂磁场、电场、离子分布等各种因素都会影响引出离子束的束流品质。本论文针对离子束传输中的空间电荷
公路桥梁高墩柱的高度多超出15 m,具有人力需求量大、工程规模大、操作条件复杂的特点。恰当利用高墩柱处理工艺,可以降低公路桥梁操作期间的压力。因此,简单介绍了一个公路桥梁高墩柱项目,论述了公路桥梁高墩柱的处理方案,探究了公路桥梁高墩柱的处理要点,并对公路桥梁高墩柱的处理结果进一步分析,希望为公路桥梁高墩柱处理提供一些技术参考。
近20年来,中国依靠制度创新、管理创新、服务创新、企业商务模式创新,迅速跻身世界电子商务大国行列,跨境电商已成为中国外贸发展的新引擎、经济发展的新动能。但要素流动限制、同质化竞争、贸易壁垒等仍影响跨境电商大发展。面对外部环境的复杂性,为打通跨境电商堵点和痛点,稳住2023年外贸增长基本盘,中国应以开放和创新为引领,提升跨境电商的国家战略定位,以贸易数字化推动跨境电商创新发展,以要素市场开放打通制约
龙门山属典型的“双复杂”勘探区域,地质成因复杂、断裂发育,属于风险勘探领域之一。地下地质构造复杂,浅层高陡构造发育、深层反射特征不清;下伏岩性、速度、厚度纵横向变化大;常规勘探资料成像精度低,难以满足油气勘探需求。针对研究区“地下地表双复杂”地震成像难题,首次在龙门山山前带采用“两高、一小、一宽三维观测系统+源驱动高效激发技术+有线仪与节点仪器混合接收”方案,地震资料品质和采集效率获得大幅度提升。