基于Q-学习的动态单机调度

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户：huachao198977

【摘要】

：

针对当前基于Q-学习的Agent生产调度优化研究甚少的现状，利用Q-学习对动态单机调度问题在3种不同系统目标下的调度规则动态选择问题进行了研究．在建立Q-学习与动态单机调度问题

【作者】

：

王世进孙晟周炳海奚立峰

【机构】

：

上海交通大学机械与动力工程学院

【出处】

：

上海交通大学学报

【发表日期】

：

2007年8期

【关键词】

：

Q-学习强化学习动态单机调度调度规则选择 Q-learning reinforcement learning dynamic single machine

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对当前基于Q-学习的Agent生产调度优化研究甚少的现状，利用Q-学习对动态单机调度问题在3种不同系统目标下的调度规则动态选择问题进行了研究．在建立Q-学习与动态单机调度问题映射机制的基础上，通过MATLAB实验仿真，对算法性能进行了评价．仿真结果表明，对于不同的系统调度目标，Q-学习能提高Agent的适应能力，达到单一调度规则无法达到的性能，适合基于Agent的动态生产调度环境．

其他文献

利用二次灵敏度的渐进结构频率优化算法

针对标准渐进结构优化方法用于频率优化时难以达到计算效率和准确性之间的平衡,提出了二次灵敏度的概念,给出其计算公式,并且提出了一种利用二次灵敏度的频率优化算法.该算法

期刊

渐进结构优化拓扑优化频率优化有限元分析evolutionary structural optimization topology optimizatio

对中国共产党加强领导干部能力素质建设的思考

造就一支适应中国特色社会主义建设需要的高素质干部队伍,是关系党和国家事业兴衰成败的关键问题。深刻总结九十年来中国共产党对领导干部能力素质建设的成功实践和基本经验

期刊

领导干部能力素质历史经验

一种降低STTC译码复杂度的编译码方案

提出一种空时网格码（STTC）码字设计思想,在发射信号之间引入确定的空间和时间关联性,并设计了一种称为反馈-干扰抵消检测的新解调方法.该方案在保证频谱利用率不变的情况下,使

期刊

空时网格码分集增益编码增益反馈-干扰抵消检测计算复杂度space-time trellis code （STTC） diversity gain co

分享阿拉斯加“新鲜味”

2005年9月绿茵阁十六周年之际，绿茵阁与美国阿拉斯加州海产市场协会合作推出的第一期阿拉斯加美食节曾创下了广州市场单日销售3200份的最高销售记录。

期刊

阿拉斯加州销售记录广州市场美食节合作

核电厂检修局部干法自动水下焊接实验

根据核电厂内部结构维修的特殊性,研制了一套局部干法自动水下焊接实验系统,进行了15 m水深局部干法自动水下坡口对接焊实验,并采用集成汉诺威弧焊质量分析仪对自动水下焊接的工艺过程进行分析．结果表明,焊缝成型良好,能够满足相关执行标准的要求,为核电站堆内构件在役维修技术的发展奠定了基础。

期刊

水下焊接汉诺威分析仪熔滴过渡焊缝成型

甜味剂应小心“演绎”

休闲食品是绝大部分孩童和青少年“心头好”，然而滥用甜味剂已是食品行业的一个普遍而严重的问题。据了解，目前我国允许使用的甜味剂主要有营养型和非营养型两种。营养型甜味剂

期刊

甜味剂演绎休闲食品麦芽糖醇阿斯巴甜营养型食品行业无糖食品木糖醇青少年

益生菌发展背后仍存“隐忧”

近期，一些新推出的酸奶产品上都标注了“益生菌”字样，细心的消费者便会发现，传统酸奶中添加的是两种菌类（嗜热链球菌和保加利亚乳杆菌）；而标识上有“益生菌”字样的新品中添加的是

期刊

益生菌中国奶业协会保加利亚数据显示高速发展奶产品消费者酸奶乳酸菌

泛珠印刷业合作拓海内外市场

中国印刷业经过多年发展，已形成“珠三角”、“长三角”、“环渤海”三大区域印刷基地，它们共同构成了推动我同印刷业发展的三大引擎。这些区域集中了我国众多上规模的大型印刷

期刊

印刷业合作区域印刷基地“长三角”印刷企业带头作用改革开放市场接轨珠三角环渤海国际化规模产业

关于进一步发展新疆双语教育的思考

语言是信息交流的工具。在科技迅速发展的今天,实施双语教育更为重要,多年来新疆各级党委政府高度重视双语教育,并取得明显效果,但同时也存在一定困难和问题,我们必须采取有

期刊

新疆双语教育思考与对策

浅谈工业互联网环境下的网络入侵检测系统设计

随着工业互联网建设的快速推进,其安全保障体系重要性日益突显。针对工业互联网环境下的网络入侵检测系统设计问题,从防护模式、系统构成、技术方向、响应方式等方面进行了深

期刊

工业互联网网络安全入侵检测系统设计

基于Q-学习的动态单机调度

与本文相关的学术论文