基于强化学习的超参数优化方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:qiaolei8214122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器学习算法广泛应用于多个领域.超参数的选择直接影响了算法模型的性能,然而超参数优化过程往往依赖于专业知识和长期经验的积累.为了解决上述问题,本文提出了一种基于强化学习的自动超参数优化方法.该方法将超参数优化问题作为序列决策问题并建模为马尔科夫决策过程,通过使用一个强化学习智能体( agent),自动为机器学习算法选择超参数.该智能体以最大化待优化模型在验证数据集上的准确率为目标,将模型在验证数据集上的准确率作为奖赏值( reward),通过策略梯度算法训练智能体.为了减小训练过程中的方差,我们设计了数据引导池模块.实验将随机森林和XGBoost算法作为优化对象,在五个数据集上与随机搜索、贝叶斯优化、TPE、CM-AES和SMAC五种优化方法进行了对比.实验结果显示,本文所提出的方法在90%的优化任务上表现出更优的性能.同时,我们通过执行一系列消融实验验证了agent结构和数据引导池的有效性.
其他文献
本文提出哑元位置隐私博弈机制,目的是在满足服务质量的基础上,最小化整体效用代价.该机制根据LBS中查询用户设定的当前查询的隐私保护需求,将用户的真实位置经坐标转换为哑
Web服务在网络服务中得到了广泛的应用,因此也成为了不法分子的主要攻击对象.现阶段针对Web攻击的检测技术可分为误用检测与异常检测.基于误用检测的Web异常检测存在规则特征
针对传统相关滤波跟踪算法中单一特征在复杂环境下出现跟踪失败情况,提出一种融合传统特征、卷积特征及上下文信息的运动跟踪方法.通过固定权重融合目标及上下文信息的方向梯度直方图特征响应图和目标颜色直方图特征响应图,再自适应融合卷积特征响应图以更好地跟踪目标,对目标尺度变化问题采用尺度池方法.在标准测试集(OTB-50)中验证了本文算法,与基于传统特征及上下文信息的算法相比,平均距离精度提高了6. 1%,
针对四旋翼飞行器的不完全驱动、状态耦合严重、易受外界干扰等问题,提出了一种串级自抗扰控制方法.通过欧拉及牛顿定理建立四旋翼飞行器动力学模型.内环针对姿态角速度控制
在Computer Vision(CV)领域应用模型的开发过程中,领域专家和技术人员之间的沟通存在很大问题,同时,种类繁多的CV算子间的组合调用较为困难,难以集成.为解决以上问题,本文基于Xtext框架,采用模型驱动开发的方式,设计实现了面向计算机视觉的领域特定语言——Computer Vision Domain Specific Language(CVDSL). CVDSL整合了常用CV算子,为
准确的剩余使用寿命预测在数字化车间的预测和健康管理中起着至关重要的作用.如数字化车间安全保证中最重要的环节是故障的排查和维修,但是目前故障的排查和维修都是需要在停
针对图像协同显著性检测问题,提出了一种基于元胞自动机的低秩加权检测方法.利用3个显著性检测算法生成多个显著图,结合超像素分割提取协同显著性区域.在协同显著区域的特征矩阵上施加秩约束,以获得稀疏误差矩阵,基于稀疏误差矩阵为每个显著图计算自适应权重.将显著图与其对应的权重相乘以获得融合的协同显著图,利用元胞自动机更新显著性区域.在MSRC和i Coseg数据集上的实验结果表明,相对于其他的算法,本文算
针对产品信息交换中设计意图语义挖掘需求,以STEP AP242为基础,构建产品三维几何信息与非几何信息语义关联的STEP知识图谱,实现STEP设计意图提取和交换.重点研究了STEP知识图
人脸表情识别任务在近些年取得了广泛的研究和应用,但是由于装饰物以及人的行为等其他因素,会对人脸的局部区域产生遮挡或破损,从而降低了表情识别的精度.针对有局部破损或遮挡的低质人脸图像表情识别,本文提出了一种基于端到端的低质人脸图像表情识别方法.本文通过在现有的人脸数据集上人为添加破损或遮挡作为低质样本集,利用生成对抗网络修补破损的区域,将复原后的图像和低质的图像以及原始不存在局部遮挡或破损图像通过分
在通过生物特征对人脸认证识别时,针对支持向量数据描述存在不能紧密包裹、没有合适拒识机制、正确识别率不能逼近100%的问题,提出了一种具有合适拒识机制的高正确识别率分类器设计算法—基于同类特征点集和包裹点集的同类特征区域紧密包裹曲面的求解算法,设置所有紧密包裹面之外的公共区域为分类器的拒识区域,用ORL人脸库和扩展Yale B人脸库各自作对比实验表明,本文的方法在较小拒识率情况下,分类器正确识别率能