开放车间调度问题下融合强化学习的遗传算法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:vialli_7
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
带约束的开放车间调度问题是开放车间调度问题的变体,此类问题在各个领域应用广泛而且更接近现实场景。其中,因机器间的距离而导致工件加工时间需额外增加转运的运输时间是最常见的约束,即带运输时间的开放车间调度问题。当问题的解空间巨大且约束条件复杂时,对最优解的求解相当困难。当前,以遗传算法为代表的传统算法对运输时间编码困难而且对交叉算子的利用效率较低,往往只能得到质量不佳的局部最优解。近几年,强化学习因其独特的训练方式及强大的决策能力在组合优化领域得到广泛应用。本文结合强化学习对遗传算法做出改进以解决带运输时间的开放车间调度问题。主要研究工作如下:针对遗传算法对运输时间编码困难以及对交叉算子利用效率低的问题,本文提出了一种结合强化学习的遗传算法改进算法(GARL)。算法首先以工序为核心对问题进行抽象,并以工序与机器、工件之间的归属信息、工序的加工信息、工序间的偏序信息等信息构建抽象图。再以序列化为基础,用门控循环单元处理工序间的偏序关系并得到问题的隐表示。此外,算法使用演员-评论家强化学习模型优化遗传算法中的交叉操作,包括扩充交叉算子的类型和数量、使用演员网络选择算子执行交叉操作以及将较优子代完工时间的负值作为评判动作的标准。算法在取消变异操作的基础上整体按照遗传算法流程执行,以最小化问题的完工时间为目标进行优化。最终,GARL算法在求解质量、收敛性能以及迭代性能上得到了更好的效果。为进一步优化算法,本文提出了基于种群特征提取的GARL优化算法(GARLP)。种群在遗传算法中能直接表示当前解决方案的优劣也能间接表示算法继续优化的潜力。为增加状态信息维度,本文从种群的数量、空间及遗传特性角度构建了完工时间均值、完工时间差的均值、斑块规模等种群特征。为鼓励算法考虑种群整体信息,本文根据种群特征设计了种群回报,结合子代个体的回报对回报建模进行了改良。经过实验对比,算法的收敛性能得到有效提升,通过延长算法的收敛轮次提升了算法对于优化目标的探索能力。
其他文献
本文论述了七例不同的新型硼酸盐晶体材料,通过单晶X射线衍射表征了它们的结构,通过固体紫外可见漫反射光谱、红外光谱、X-射线粉末衍分析(PXRD)和元素分析进一步表征了它们的结构。还通过热刻蚀制得了一系列硼酸盐基催化剂,测量了系列催化剂的氧还原反应(ORR)催化活性。化合物Co2(DMEDA)3[B5O7(OH)3]2(DMEDA=N,N-二甲基乙二胺,1)与化合物Zn2(DMEDA)3[B5O7(
学位
人体姿态估计和跟踪是计算机视觉领域的经典问题,该任务既涉及底层的特征表达,又为高层的动作识别、场景理解提供支持,因此具有重要的理论意义。近年来,随着网络视频大量涌现,视频中人体姿态估计和跟踪任务受到广泛关注,在人机交互、智能监控等领域拥有了更广泛的应用价值。视频人体姿态估计具有挑战性,将现有的针对静态图像的人体姿态估计算法直接用于视频序列,性能大大降低,因为这些方法通常缺乏对视频序列之间的时空相关
学位
阵发性睡眠性血红蛋白尿症(PNH)是一种获得性造血干细胞克隆性疾病,其病变细胞X染色体PIG-A基因突变与PNH细胞克隆增殖及疾病进展密切相关。伴随着PNH发病机制研究的不断深入,其诊断和治疗模式也取得了重要进展,尤其是靶向模式的出现为PNH的治疗提供了新的策略,依库珠单抗的问世使PNH的治疗进入补体通路抑制时代,由于其存在原发耐药、血管外溶血、停药后病情易反复等不足,使针对补体通路活化的新药研发
期刊
随着信息化时代的到来,每天产生的数据量逐渐增多。传统的人工智能技术通常需要以批量训练的方式来处理这些数据,然而这种批训练的方式对于持续的数据流来说,模型需要重新训练所有数据以避免灾难性遗忘,因此,人们需要利用更灵活的策略去处理这些海量数据,从而更好的为社会服务。增量式的学习策略可以很好的解决这种持续数据流的问题,它不仅缩短了大量的训练时间,而且能够解决灾难性遗忘问题。然而,目前学术界的增量学习算法
学位
青霉素的发现挽救了无数人的生命,因此也被认为是20世纪最重要的科学发现之一。尽管如此,抗生素的误用和滥用缩短了细菌耐药性的出现周期。耐药细菌的出现使得临床抗生素失去了治疗细菌感染的效力,因此迫切需要开发新型抗菌药物来解决抗生素的耐药危机。细菌细胞的分裂对细菌的活力以及生长繁殖都至关重要,其中,丝状温度敏感突变体Z(Fts Z)是细菌细胞分裂所需的关键蛋白质之一,是第一个到达分裂位点的细菌分裂蛋白。
学位
三重态-三重态湮灭(TTA)光子上转换是一种能将较低能量(较长波长)的光转换为较高能量(较短波长)的光的技术,目前它在能源和生物学等领域都得到了应用。相比于其它两种上转换技术(双光子吸收和稀土上转换),TTA上转换可以利用较低强度的非相干激发光,并且该技术较高的上转换量子产率以及易于调谐的激发与发射波长使其在光伏、生物成像、光催化等应用方面具有独特的优势,受到研究者广泛的关注。早期基于有机溶剂中的
学位
直链烷基苯(LAB)是非常重要的中间体化合物,一般由苯和长链烯烃烷基化反应进行制备。由于其具有较好的生物降解性和溶解性等特点,主要被用于世界上合成产量最大的表面活性剂直链烷基苯磺酸盐(LAS)的生产,进而用于制备各类洗涤产品。然而,目前在工业上LAB的生产依旧是以传统的HF工艺为主,这类均相催化剂对LAB的选择性差,尤其是对生物降解性最好的2-LAB的选择性较差,原子经济性较低,同时还有明显的设备
学位
报纸
自动驾驶技术是一种使汽车在无人为干涉情况下自动行驶在路上的技术,在帮助解决社会问题、提升综合国力等方面有着重要意义。近年来,自动驾驶应用场景从无人公路到乡村城市,趋于复杂,密集城市驾驶场景成为当前自动驾驶研究的主流场景。城市驾驶任务受高级导航指令指挥,结合城市具体路口场景进行不同的转向行为,无法使用一个通用模仿学习模型对复杂场景中的问题进行有效建模。本文通过研究城市驾驶场景特点,提出了分层模仿学习
学位
医学人工智能的核心目标是实现临床辅助诊疗,进而协助提升临床诊疗能力。由于医学知识图谱具有丰富的领域知识,对临床诊疗往往起到关键作用,因此,知识图谱及其推理应用研究在医学人工智能中具有重要地位。中医临床诊疗过程是一个演绎推理的过程,因此基于知识图谱进行辅助诊疗至关重要。而这一研究存在如下几方面问题:(1)知识图谱的构建是一个系统工程,现有的医学知识图谱还有待不断扩展,存在不完整性问题;(2)在辅助诊
学位