基于聚类状态隶属度的动态调度Q-学习

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:zhehong220
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种利用Q-学习解决动态单机调度环境下的自适应调度规则选择的方法。该方法针对动态调度环境中系统状态空间大,Q-学习不易收敛的特点,首先提取系统状态特征,对系统状态进行合理聚类,有效地降低系统状态空间维数,然后在学习过程中令设备Agent根据瞬时状态向量对各聚类状态的隶属度做出综合判断,选择合适规则,并在每次迭代后根据隶属度将动作奖惩分配给各聚类状态的动作值函数。仿真结果表明,所提Q-学习算法较之传统Q-学习具有更快的收敛速度,提高了设备Agent的动态调度规则选择能力。
其他文献
“发展学生的地理思维能力”是高中地理课程重要目标之一。认知心理学认为,了解学生如何在头脑中构造认识,并帮助其建立认知结构是提升学习能力的根本。所谓认知结构,是指将学科知识的内部联系和规律内化在学习者头脑中,形成一定观念的内容和组织。对于学习地理知识而言,认知结构可理解为感知、记忆、理解空间关系的一种认知模式和思维模式。  区域地理知识杂乱而繁琐,部分教师在教学中常将地理位置、气候、地形等地理要素简
文章从静悄悄的无探究教学模式到热闹非凡的假探究教学模式再到亦动亦静的真探究教学模式的变化过程结合本人在教学过程中对探究教学模式的实施,谈几点自己对探究教学模式的看
【摘 要】预设利用盖斯定律和燃烧热可以求出某些反应的反应热,过程复杂,耗时长,结果不准确,在实际教学中和学生共同探讨,结合能量最低原理中的稳定状态进行假设,燃烧热即为该燃料的能量,计算起来方便得多。尤其适用于未给定热化学方程式的相关试题。最后生成稳态法在燃烧热计算中的应用技巧。  【关键词】燃烧热;盖斯定律;稳态法  一、预设背景:  据《2013年普通高等学校招生全国统一考试大纲的说明(理科·课
对全复用多小区系统下行链路用户调度与功率分配问题进行了研究,提出了一种半分布式的用户调度与功率分配方案。首先,各小区根据自身所辖用户的信道与干扰信息,采用最大信干噪比
综合了固有光学量的反演和透明度与固有光学量的关系,构成了基于固有光学特性的透明度遥感算法。将此算法应用于北部湾的MODIS遥感数据,得到了该区域的透明度,并利用实测透明度对遥感反演结果进行了验证。通过对时间窗口为±48h,空间窗口为1km的30组实测与遥感匹配数据的统计分析(实测透明度在1.8~26.0m范围),得到平均百分比误差(ε)为22%,对数均方根误差(1og_RMSE)为0.121。而基
为改进基于数据库垂直表示的频繁项集挖掘算法的性能,给出了用索引数组方法来改进计算性能的思路。提出了索引数组的概念及其计算方法,并提出了一种新的高效的频繁项集挖掘算法
【摘 要】随着课程改革不断推进,改革不断深化,在初中进行的初中英语教学课堂中。教学观念以及教学方法都有所改变,选择有效的教学方式可以提升初中英语课程教学质量。但是,在当前英语课程教学过程中,出现词汇、语法以及阅读问题,这些问题大量存在。学生学习音乐的主体性得到展现,这样的教学方式阻碍了学生全面发展,降低了学生综合素质。文章对当前课程教学中存在的问题进行分析,提出了英语课程的优化策略。  【关键词】
研究了存储器内建自测试(MBIST)和存储器自修复(MBISR)技术,改进了基于一维冗余(冗余行块)结构的嵌入式存储器修复策略。首先将存储阵列和冗余阵列划分为多个行块,然后采用存储器自测
提出了一类带约束的二进制矩阵型染色体的编码方法。相对于传统向量型染色体编码方法而言,该方法可以通过在矩阵中设置“禁止位”将复杂优化问题的若干约束条件在编码中体现出
为了处理好复杂产品各子系统之间的耦合关系以及各子系统的异构性问题,以协同优化(CO)算法为基础,结合系统不确定分析(SUA)方法和近似不确定传播(IUP)方法,构建了多学科鲁棒协同设计优