基于强化学习的算法及超参数推荐平台的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：tsmljgh

【摘要】

：

【作者】

：

陈森朋

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2021年01期

【关键词】

：

机器学习深度学习超参数优化模型选择强化学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在问题规模不断增大的背景下,机器学习和深度学习的应用门槛越来越高,且需要极具经验的人工干预。然而,人工干预往往需要耗费大量的时间和计算成本。为了更好的解决上述限制,本文针对机器学习和深度学习流程中的超参数优化以及模型选择两个流程进行深入研究并实现高效的算法。对于超参数优化问题,本文以强化学习作为技术支持,实现了一种超参数优化方法。该方法通过序列选择各个超参数的方式,能够减少每一步超参数的搜索空间,降低探索难度,从而提高优化效率。同时,为了解决传统超参数优化方法中评估耗时的问题,本文通过使用预测模型直接评估超参数配置。并且,为了防止预测模型引入过大的误差而导致次优策略,该方法计算预测模型使用前后策略的距离以动态控制模型的使用次数。为了进一步提升时间效率,本文通过利用历史的优化经验,其中历史的优化经验包括历史其他优化任务的经验和当前任务的优化经验。除此之外,相对于传统优化方法,该方法通过超参数优化不仅能够提升模型的准确度,也能够降低模型在实际环境中的延迟时间。对于模型和超参数的双重优化问题,本文基于强化学习框架,实现了一种多分支结构的智能体,其中包括一个算法控制器和多个超参数优化控制器。具体的,通过算法控制器选择算法并以此选择对应的超参数优化分支。同时,在该问题的解决上同样使用了超参数优化方法中的预测模型和使用方式来进一步提升时间效率。最后,本文通过在多个数据集上对比当前比较先进的优化方法,实验结果验证了本文所提出方法在时间效率和优化结果方面都是可行且有效的。同时,本文也进行了合理和公正的消融实验来说明各个组件的有效性。综合所有实验结果,可以说明本文所提出的方法能够在多个性能指标上优于其他优化方法。

其他文献

单阶段目标检测算法研究与运用

近年来,目标检测算法不断推陈出新,检测速度与识别精度都有了很大的提升。单阶段的检测模型形成了一个相对固定的算法框架,但模型本身存在一些缺点和不足。首先,单阶段目标检测模型采用人为设定参数的方法生成检测边框,容易出现检测边框泛化性差的问题,造成模型在不同数据集的模型性能差异很大。同时,模型的检测边框在回归过程中,边框回归损失值并不能很好的反应出边框回归效果的真实好坏。具有相同回归损失值的边框的回归效

学位

目标检测SSD模型K-means聚类边框回归

初等数学知识图谱的构建以及表示方法的研究

随着互联网和大数据的快速发展,全球每时每刻都在产生海量的,结构化或者非结构化的数据,这些数据格式多样化,有图片,文本,音频,视频等等。由于数据的多样化以及数据表示的多样性,大数据不经过结构化处理在许多情况下将无法有效的应用。本文重点研究多源异构的非结构化、半结构化初等数学领域数据如何表示为结构化数据,并依据数学领域知识图谱构建的方式构建初等数学概念知识图谱。然后将构建完成的概念知识图谱应用到纯数学

学位

结构化数据概念知识图谱题目知识图谱图嵌入模型实体抽取知识推理三元组

基于容器技术的Android云交互系统研究与实现

近年来云计算发展越来越迅猛,并在大流行中对全世界的复苏发挥重要作用,而虚拟化作为云计算的关键技术之一,也在不断地发展,作为软件虚拟化应用之一的桌面虚拟化技术在企业中也得到更广泛地使用。与此同时,Android手机全球出货量趋于收紧,受大流行影响,这一情况进一步加剧。目前市面上桌面虚拟化技术大多面向传统PC系统,缺乏对移动端系统的支持。Android手机长期受困于恶意程序偷取用户隐私现象;不仅如此,

学位

虚拟化Android桌面云容器技术云交互协议

城市道路短时交通流预测方法研究与应用

随着中国城市化进程的加快,城市汽车保有量不断增加,城市交通需求呈现增长态势,引发出交通拥堵、交通事故等一系列关乎民生福祉的问题,严重阻碍了城市的高质量发展。在当前的城市智能交通系统中,快速准确的交通流预测是城市交通控制的必要前提,在智能交通系统中发挥着重要作用。基于以上背景,本文对道路数据特征展开研究,提出了不同交通原始数据情况下的两种短时交通流预测方法,设计并实现了一个短时交通流预测系统,主要工

学位

短时交通流预测深度学习组合模型预测系统

面向复杂场景的轨迹预测技术研究与实现

随着科学技术的发展,各种各样定位设备不断涌现,可获取到轨迹数据的数量与种类迅速增长。对获取到的轨迹数据进行储存,分析在行为识别、交通规划、城市安全与防控等方面都可以发挥重要作用。其中,对人类轨迹的研究可以获取行为方式、个人偏好等关键信息,对许多领域的进一步研究都有推进作用。因此研究行人的轨迹预测算法具有重要意义。传统的轨迹预测方法基于数学统计模型对行人的运动模式建模难以适用于复杂场景。复杂场景中存

学位

深度学习行人轨迹预测注意力机制自适应图卷积网络

城轨车辆紧急通风逆变器启动问题分析及改进

在城轨车辆运行试验过程中发现了车辆存在紧急通风逆变器不能启动的问题，针对该问题分析逆变器的启动工作原理，核查设备与车辆的接线点位及线缆的走线路径，最终确定问题的根本原因是由于设备干扰导致误触发停止信号使逆变器无法启动，经研究对电路进行改进，并经过实际运用验证表明改进措施行之有效。

期刊

紧急通风逆变器启动故障干扰

文本摘要生成技术研究与应用

现代社会,随着互联网技术的高速发展和信息化时代的到来,全球信息量暴增,人工处理信息的速度远不能满足人们的需求。自动文本摘要技术可以帮助人们快速从文本中精炼出重要信息,从而提高人们信息获取的效率。自动文本摘要技术主要分为抽取式和生成式两大类,两类方法有不同的使用场景。为了满足不同的应用需求,本文对抽取式的TextRank算法和生成式的PreSumm模型进行了研究,并对其中存在的问题提出了改进方法,提

学位

文本摘要抽取式FB-TextRank算法生成式BT-Summ模型

中印文学比较研究回顾与展望

报纸

文学比较印地语文学印度人中国经典姜景奎作家作品《大唐西域记》外文出版社

电信运维容量分析系统的设计与实现

伴随着信息技术以及各种互联网企业的迅猛发展,面对爆炸的数据以及种类繁多的新业务,传统老旧的运维方式已经不能满足一个大型企业的需求,高昂的人力成本也是人工运维必须要去面对的一个问题。在此场景下,一个高智能化的运维系统显得尤其重要。因此,针对上述问题,人们提出了一种基于机器学习的智能化运维（AIOps）技术来解决这些困难。容量分析是智能运维（AIOps）中极为重要的一个部分。本文研究的电信运维容量分析

学位

智能运维容量分析HadoopMapReduceSpringBootHdfs

基于多模态表征学习的源代码搜索研究

源代码搜索是指根据自然语言查询语句获取对应的函数代码片段。其中主要涉及了自然语言处理技术,并通过将自然语言处理技术引入到源代码文本上,实现跨越自然语言与源代码两种模态形式进行搜索。现有的方法基于传统的序列表示模型分别处理自然语言语句与源代码文本输出形成向量表征形式,经过相似性比对实现搜索任务。但传统的序列表示模型例如词包模型、循环神经网络模型等对语义的特征能力抽取不足,而源代码信息含量对比自然语言

学位

多模态表示学习语义搜索源代码

基于强化学习的算法及超参数推荐平台的研究与实现

与本文相关的学术论文