【摘 要】
:
柔性作业车间调度是目前加工系统中的一个重要调度问题,对于该问题的解决方法大都存在速度较慢等缺陷,提出一种改进的Q-learning算法,设计了动态的状态空间及动作集,通过引入“Sigmoid”函数作为动态选择策略改进Q-learning算法,使改进后的算法前期随机选择动作,后期在随机选择动作和选择奖励值最高的动作中动态变化,有效改善了传统Q-learning算法容易陷入局部最优且收敛速度慢等缺陷。
【机 构】
:
辽宁石油化工大学信息与控制工程学院
【基金项目】
:
辽宁省自然科学基金指导计划重点项目(20170540589)资助;
论文部分内容阅读
柔性作业车间调度是目前加工系统中的一个重要调度问题,对于该问题的解决方法大都存在速度较慢等缺陷,提出一种改进的Q-learning算法,设计了动态的状态空间及动作集,通过引入“Sigmoid”函数作为动态选择策略改进Q-learning算法,使改进后的算法前期随机选择动作,后期在随机选择动作和选择奖励值最高的动作中动态变化,有效改善了传统Q-learning算法容易陷入局部最优且收敛速度慢等缺陷。将改进Q-learning算法应用到TSP问题中,证实改进算法的普适性和可行性,再将其应用解决柔性调度问题中,证实了其改进的有效性,提升了解决柔性作业车间调度问题的速度和精度。
其他文献
“双减”政策背景下,为了减轻学生学习负担,改变以往机械性训练的传统作业形式,使作业设计更加有效有趣,提升学生学习兴趣,落实核心素养培养目标,本文结合单元整体教学的理念,立足单元整体进行作业设计,提出“主题作业”的概念。从单元整体教学出发,化零为整,凸显主题,统筹整个单元的作业设计;深挖文本,深化主题,在作业中加深学生对话题的理解;回归生活,拓展主题,在作业中联系单元话题与学生生活,让学生学会在生活
加油加气站内建设充电设施能够有效地缓解电动汽车充电困难的问题,具有较好的市场前景。本文结合加油加气站内建设充电设施面临的安全问题,以及相关设计标准规范的要求,对充电设施与加油加气设备的安全距离进行了分析。
本文介绍一种多功能数字式磁通计,采用电子积分器将被测信号对时间积分,经过A/D转换成数字量被单片机读取、存储、处理并显示有关结果。
伴随着城镇化的快速发展,以城市为创作主要题材的影视作品逐渐进入到公众视野,此类型的影像记录见证城市的发展,也吸引受众、引起共鸣。城市纪录片记录现实、传达精神,深入探究复杂的社会层面。在树立城市精神文明风貌有其特有的传播价值,用纪录片独特的视角,记录城市的发展。
舰载直升机是海上军事力量配置和海上搜救的重要手段之一,各国高度重视舰载直升机研制工作。风洞试验是舰载直升机研制过程中不可或缺的环节,试验过程中需给舰载直升机配备专用位姿调整试验平台以负责操纵和控制其完成空间位置姿态变换。位姿调整试验平台性能将直接影响到试验结果可信度,现有的风洞支撑装置只能满足一般功能的试验,无法获得舰载直升机全面详细的空气动力参数。本文应某部要求,研制一套可用于操纵舰载直升机模拟
<正>在资本市场逐渐壮大和融资方法更新迭代的环境中,我国上市公司的并购行为早已屡见不鲜。虽然并购重组可能会出现问题,但是业绩补偿承诺协议可以在一定程度上解决信息不对称带来的并购问题,从而在并购交易中业绩承诺被广泛应用。业绩承诺指为并购经济活动所签订的条款协议,标的方向并购方应允并购后的若干会计年度内要完成目标业绩。若标的方没完成目标业绩,则要按条款向并购方补偿;相反,并购方奖励标的方。业绩承诺本质
<正>据《中国农业科学》2020年第20期《施钾水平对纽荷尔脐橙养分、产量和品质的影响》(作者张绩等)报道,为了通过不同施钾水平对纽荷尔脐橙树体养分吸收、产量和品质的影响研究,提出纽荷尔脐橙适宜施钾量,为纽荷尔脐橙钾肥的科学合理施用提供理论依据,以7年生枳砧纽荷尔脐橙为试材,设置0(K0)、0.38(K1)、0.64(K2)、0.89(K3)、1.28(K4)和1.40 kg/株K2O(K5)6个
阿尔弗里德·克虏伯,稳重而内向,执着而传统。事业的成功,使他获得了"天使"的美誉;为纳粹效力,又使他背上了"魔鬼"的骂名。