面向作业车间调度问题的强化学习算法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:liangxiaoyan0307
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作业车间调度问题是一个经典的组合优化问题,其应用涉及车间加工、机场调度、军事调度等多个领域。近年来,随着强化学习技术的飞速发展,其在越来越多的领域展现出强大的性能,多种利用强化学习求解组合优化问题的新方法相继被提出。然而,利用强化学习算法求解组合优化时,一些问题的数据表示较为复杂,往往包含丰富的结构特征。如何有效提取这些结构信息并将其表征为马尔科夫决策过程中的状态,以确保智能体进行有效决策,是一个有前景的课题。本文主要研究如何用强化学习方法更有效的求解作业车间调度问题(Job-Shop Scheduling Problem,JSSP),其研究存在两个挑战:1)用JSSP的析取图表示作为状态时,如何设计策略网络以更好的提取状态信息将会影响到智能体的决策,从而影响求解结果。2)在使用较复杂的策略网络时,端到端的训练方式可能会引起训练不稳定或收敛较慢的问题。针对以上问题,本文主要的工作如下:1)基于用近端策略优化算法训练求解JSSP的智能体的框架,本文提出一种基于图注意力网络的策略网络,该网络首先通过图注意力网络将初始的问题表示进行编码,图注意力网络可以有效提取状态的局部结构特征,将节点信息以及状态的结构信息融入到编码向量;然后该策略网络通过一个动作选择网络基于编码向量进行决策。通过对多种规模的JSSP实例进行求解,并与传统的优先调度规则算法进行对比,验证了该算法更优秀的性能。2)基于上述策略网络,本文引入了一种预训练方法。先对数据进行增强,然后利用对比学习的思想对图编码器进行训练,本文通过预训练的方式将一些先验知识融入到图编码器中,可以让编码器先学到一个较好的状态表示,以加速下游任务的训练。通过在同一规模问题的数据集上进行训练,对比是否经过预训练的模型性能,本文验证了预训练算法的有效性。
其他文献
目的:建立西洋参标准汤剂质量评价方法,为其质量控制提供参考。方法:采用传统煎煮方法,制备15批西洋参标准汤剂,以人参皂苷Rg1、Re、Rb1、Rc、Rb2、Rd含量、转移率、出膏率及HPLC指纹图谱相似度为评价指标,建立质量评价体系。采用主成分分析法和灰色关联度法对指纹图谱进行分析。结果:15批西洋参标准汤剂中人参皂苷Rg1、Re、Rb1、Rc、Rb2、Rd的含量分别为0.47~1.46 mg/g
准确评估中国森林碳汇潜力与增汇成本的经济可行性,是科学制定碳中和林业行动方案的基础。然而针对中国森林碳汇潜力与增汇成本的不同结果差异明显,可靠性需要进一步验证。为此,基于相关文献,采用Meta分析方法,对中国森林碳汇潜力与增汇成本及其导致差异的原因展开评估。研究表明:(1)中国森林碳汇量呈现不断增长的态势,但不同研究对森林碳汇潜力测度结果存在较大差异。(2)中国森林增汇的平均成本为220.45元/
“双减”政策强调提升学校的课后服务水平,结合项目化学习的形式展开课后服务,具有多样性项目满足活动可选择性、自主性学习实现个体差异满足,以及具身性实践改善个体学习等优势。以“鲫鱼养殖记”项目为例进行课后服务,构建并实施了因应学生特质制定发展性的素养目标、根据问题诊断划分差异性的项目群体、围绕项目类型展开线索化的探究实践、依托成果展示建立科学化的评价体系的教学程式。该项目化学习的教学方式为学生开展跨学
苏轼的名篇《江城子·乙卯正月二十日夜记梦》虽然语言平易,然而近千年来却感动了无数的读者。何以感人呢?“感人心者,莫先乎情”,细读文本,师生不难发现词人通过多维层进的艺术方式带领我们走进了他的情感世界:时间维度——“十年生死”,不思难忘;空间维度——“千里孤坟”,凄凉无处;让步角度——“纵使相逢”,逢而不识;梦境角度——“幽梦还乡”,轩窗梳妆;虚拟维度——“相顾无言”,垂泪千行;揣测维度——“明月松
由碳排放量增加引起的气候变化问题日趋严重,世界各国都在积极致力于减缓全球温室气体排放的增长速度。明确城市生态空间的碳汇量,厘清城市碳中和过程中生态服务管理的优先领域,是实现“碳中和”目标的重要实施路径。采用佛山市第三次国土调查数据,基于不同生态系统类型固碳速率,通过碳汇评估模型对佛山市生态空间的碳汇能力进行评估。结果表明,2019年佛山市的碳汇总量为0.16×10~6 t,碳排放为43.90×10
本研究建立了水产品中5种磷脂的高效液相色谱-蒸发光散射检测器(HPLC-ELSD)方法并测定了几种水产品及水产品性腺组织中5种磷脂的含量。采用氯仿-甲醇(2∶1,V/V)进行磷脂的提取,氨基固相萃取柱净化富集,HPLC-ELSD对牡蛎(Ostrea gigas tnunb)、虹鳟(Oncorhynchus mykiss)、刺参(Apostichopus japonicas)、磷虾(Euphausi
针对BP神经网络容易出现过拟合和陷入局部最优现象导致电力负荷预测准确性不高的问题,建立了在不同日期和气温等影响因素下的布谷鸟算法(CS)优化BP神经网络的电力负荷预测模型.训练BP网络确定基本结构,运用布谷鸟算法搜寻最优解替换为BP网络的最优参数,结合安徽某地区的电力负荷数据进行仿真分析,可以得出布谷鸟算法优化后的预测模型相比于单一的BP神经网络准确性得到提高,证明了所建立的CS-BP模型具有良好
针对光伏发电功率的波动性与随机性对调度部门的负荷预测以及电网安全运行带来的严峻挑战,提出了一种基于变分模态分解(VMD)和布谷鸟搜索(CS)算法优化的双向长短期记忆网络(BiLSTM)光伏发电功率预测方法.首先使用VMD将光伏功率序列分解成不同频率的子模态,通过皮尔逊相关性分析确定影响各模态的关键气象因子.其次分别构建注意力机制(AM)和BiLSTM混合的光伏发电功率预测模型,利用CS算法获取网络
高校劳动教育在促进学生健康成长、落实立德树人根本任务等方面发挥着重要作用。基于粤港澳大湾区6所高校689名在校大学生的调查研究表明,当前大学生对劳动教育的价值认同较高,绝大多数学生认可劳动教育的意义和价值。但不同群体学生对劳动教育的价值认同存在差异:生源地为农村和镇区的学生高于城市的学生,父母受教育程度大专以下的学生高于父母受教育程度大专及以上的学生,非独生子女学生高于独生子女学生。行为投入方面:
随着大数据、人工智能、云计算、物联网等新兴技术的发展,大型建筑央企开始布局数字化转型,而财务数字化转型正是其重要的组成部分。文章总结分析了我国大型建筑央企财务共享服务中心的运行现状,阐述了财务数字化转型的内涵、趋势和必要性,并以大型建筑央企为分析对象,重点研究了财务大数据中心建设的基础和路径,以促进企业管理水平的全面提升。