基于强化学习和元学习的自动超参数优化研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:simetl1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习技术的广泛应用,其面临的实际问题也日趋复杂,问题规模不断扩大,且搭建机器学习系统的过程中需要专业人士的人工干预。而人工干预将导致时间和人力资源的大量消耗,限制了机器学习技术在各个领域的进一步落地使用。为了解决以上问题,本文针对机器学习系统搭建过程中的超参数优化问题进入了深入研究并提出了几种有效的解决方案。针对超参数优化问题,本文基于强化学习和元学习实现了一种超参数优化方法。该方法将超参数优化问题建模为连续决策过程以减小搜索空间,并将其扩展为马尔科夫过程,基于此设计强化学习智能体序列地选择超参数配置。同时设计预测模型对超参数配置性能进行预测而取代实际评估过程,从而提高整体优化效率,并且通过对预测模型交替执行训练和使用两阶段来保证预测模型的准确性。此外,引入元学习技术对预测模型进行元训练以利用历史任务上的经验,提高新任务上的优化效率。为提高智能体在新任务上的通用性和优化效率,本文提出了基于上下文的元强化学习的优化方法。其设计了上下文信息对历史任务经验进行保存和利用,同时从中提取任务表征帮助智能体决策。并采用简单高效的基于多任务目标的元训练方法帮助智能体获取历史经验。而在新任务适应阶段引入平方项惩罚技术对元参数在新任务上的更新进行限制以充分利用历史任务的经验。此外,为了进一步提高新任务的优化效率,本文提出了基于任务感知的上下文元强化学习的优化方法。该方法有效利用任务表征信息和任务解决经验快速解决新任务,极大提高了新任务上的优化效率。最后,本文通过在多个数据集上与其他先进优化方法的对比实验证明了本文所提出方法的优势,并通过相关消融实验证明了本文所提出方法中各个组件的科学性和有效性。
其他文献
<正> 宋××,女,24岁,1993年12月19日初诊。2年前颜面及下肢浮肿,按之凹陷,小溲短少。曾反复发作,西医诊断为慢性肾炎。2个月前,因劳累过度,上述诸症加重,开始治疗时投以大量中西利尿剂,小便虽有增加,但浮肿时轻时重,细观其面色晦暗,腰膝酸软,四肢清冷,纳差,舌质暗红胖
期刊
随着计算机视觉在各行各业越来越多的应用,业界对其实时性、内存消耗等性能要求也越来越高。然而,目前绝大多数视觉算法都是为计算资源充裕的服务器设计的,并不适用于资源受限的嵌入式终端。而针对嵌入式设备设计的视觉算法,也较少通过GPU对算法进行细粒度的拆分或优化,导致端到端延迟较高。基于以上背景,针对现有计算机视觉算法的GPU加速和细粒度重构问题,本文在多核CPU+GPU异构环境下,面向行人目标追踪,研究
学位
近年来,语义分割任务越来越受到计算机视觉领域研究者们的关注,是当前人工智能领域的研究热点之一。目前最先进的语义分割方法往往为了达到较高的性能而带来巨大的计算开销,难以做到推理速度与模型精度的平衡,并且对于硬件资源受限的设备来说难以部署。由于实时语义分割在人工智能领域应用的广泛性和必要性,所以吸引了众多的研究者,但是使语义分割模型能够达到分割速度与精度的平衡是一项具有挑战性的任务。为了解决这一难题,
学位
近年来,计算机视觉研究领域越来越受到关注,其中分类任务、检测任务以及分割任务更是计算机视觉中的重点研究方向。随着深度学习技术的发展,目标检测模型的精度虽在不断提高,但是作为监督学习来说,其需要大量带标注训练样本的本质并没有改变。在实际场景中,训练出一个特定的目标检测模型需要大量的标注样本,而某些特定目标类别图像的获取具有一定难度。小样本学习致力于缓解该类问题,并且在图像分类任务中已具有一些研究成果
学位
三维目标的姿态估计能够获得目标的姿态信息,支撑对目标的精细操作和动作识别,在机器人操控、自动驾驶、增强现实中都有着重要的应用。目前,机器人、自动驾驶汽车等已经能够在空间中对目标进行很好的定位,但如果需要和环境中的目标进行交互,目标姿态估计是必需的技术,也是目前研究的热点之一。本文通过深入分析后发现目前姿态估计存在以下问题:(1)无纹理目标、遮挡缺失目标提取特征困难;(2)对于多维特征融合利用不够充
学位
为了激发小学中、高年级学生对小学语文学习的兴趣与热情,提高语文课堂的教学效果与学习效率,课堂导入的作用我们不容忽视。基于此,对小学语文教学中的导入环节进行深入探究是十分必要的。本文将小学语文课堂教学作为研究对象,文章首先阐述了课堂导入对于更好地开展语文课堂教学所产生的积极作用,然后对小学中常用的几种导入方法作出分析,接着给出导入注意事项,之后又对烘托课堂气氛的方式进行说明,最后对课后常用总结方法进
期刊
不同于传统搜索引擎基于输入关键字来匹配并排序网页结果,基于机器阅读理解的问答系统在理解用户问题和对应上下文后,能够直接准确地返回答案文本,为用户提供一种高效、准确的信息检索方式,被广泛用于辅助决策、社区问答、聊天机器人以及智能客服等应用场景中,具有良好的发展前景和应用价值。随着各种问答数据集的陆续发布以及GPU算力的显著提升,问答系统研究逐渐由传统的浅层语义分析向基于深度学习模型的深层语义理解转变
学位
战略支援部队“战略尖刀”文化诞生于习主席领航强国强军伟大征程,集成各部队精神文化共同基因,适应新型作战力量使命任务特点,凝结部队组建以来精神文化建设成果,满足新时代官兵精神文化需求,形成“绝对忠诚、激情奋进、胜强超越、勇于创新、团结融合、无私奉献”精神内核,集中体现了部队各领域各战线优良传统和精神特质,充分反映了一代代官兵艰苦创业、锐意进取的价值追求和时代风貌,是夺取新型作战力量建设新胜利的精神秘
期刊
随着当前世界全球化趋势的日益深化,不同文化和语言群体之间的经济贸易、社会文化交流也不断发展。多语言能力和多语言人才的必要性和需求也不断地的稳固深化。我国的外语学习不再局限于英语作为单一通用语,法语外语的教学也不断发展。然而理论研究表明学习者的语言经历对语言表达、学习和交流能力的形成和发展产生影响。学习者所掌握的语言之间也存在跨语言的迁移影响现象。因此,探索这种影响的方式和关键因素就对我国的法语外语
学位
文章通过计算水资源承载力和负载指数,评价分析本溪市2005—2020年的水资源压力变化趋势。结果表明:2005—2020年本溪市水资源负载指数总体呈上升趋势,水资源压力和承载力也表现出增大趋势;为有效缓解城市水资源压力,进一步增强水资源承载力,要加强水资源的科学有效管理,加快推进高水平先进节水技术的应用。
期刊