【摘 要】
:
多目标旅行商问题是典型的组合多目标优化问题,现实生活中物流配送等问题都可以转化为多目标旅行商问题求解。相比于经典旅行商问题以距离为单一目标,多目标旅行商问题还加入了时间、风险等其他目标。目前,一种常用的方法是基于种群的多目标进化算法。但是,多目标进化算法的个体针对具体问题编码。当问题的城市数量或城市坐标发生任何变化时,都需重新运行算法求解,从而消耗大量的迭代时间。另一种常用的方法是深度强化学习算法
论文部分内容阅读
多目标旅行商问题是典型的组合多目标优化问题,现实生活中物流配送等问题都可以转化为多目标旅行商问题求解。相比于经典旅行商问题以距离为单一目标,多目标旅行商问题还加入了时间、风险等其他目标。目前,一种常用的方法是基于种群的多目标进化算法。但是,多目标进化算法的个体针对具体问题编码。当问题的城市数量或城市坐标发生任何变化时,都需重新运行算法求解,从而消耗大量的迭代时间。另一种常用的方法是深度强化学习算法。由于深度学习的表征能力和强化学习的决策能力,深度强化学习算法不仅能获得收敛性更好的解集,还具有一定的泛化能力。但是,由于分解方法的不足,深度强化学习算法在复杂前沿上求得的解集不均匀,还存在很大的改进空间。针对两种算法存在的优势和不足,本文通过不同的方式结合两种算法,从而产生性能更好的算法。一方面,本文针对多目标进化算法的不足,提出一种深度强化学习指导的多目标进化算法,提高多目标进化算法的泛化能力。另一方面,本文针对深度强化学习算法的不足,提出一种基于NBI分解的多目标深度强化学习算法,改善解集的分布。本文的主要研究工作和创新点总结如下:(1)本文在基于分解的多目标进化算法MOEA/D的基础上,提出了深度强化学习指导的多目标进化算法DRL-MOEA。该算法中每个指针网络的所有模型参数被编码为一个个体,负责一个子问题的优化。针对个体编码方案,综合设计了两种子个体生成方式。一种使用深度强化学习对父个体中的模型参数进行梯度下降局部优化;另一种使用基因变异对父个体中的模型参数进行随机扰动全局优化。根据两种子个体生成方式,进一步设计了双种群更新策略,分别维护进化过程中生成的优秀个体与梯度下降局部优化后生成的个体。(2)本文在深度强化学习算法DRL-MOA的基础上,提出基于NBI分解的多目标深度强化学习算法MODRL-NBI。算法采用NBI风格的分解方法将多目标旅行商问题分解为多个单目标旅行商问题,每个子问题都使用一个指针网络进行求解。对于每个指针网络,设计基于NBI-TCH的损失函数对其进行梯度下降训练,并把训练好的指针网络通过迁移学习传递给下一个子问题,直至所有的指针网络训练完成。(3)在二目标旅行商问题的欧几里得实例上,分别对本文提出的两种算法进行全面的性能评估,并与多个主流算法进行对比,从而验证这两种算法求解多目标旅行商问题的有效性。实验结果表明,本文设计的深度强化学习指导的多目标进化算法DRL-MOEA能有效应对城市数量和城市坐标的改变,提高多目标进化算法的泛化能力,并且通过基因变异调整解集分布,获得超体积值更优和分布更好的解集。而基于NBI分解的多目标深度强化学习算法MODRL-NBI提高了深度强化学习算法对复杂前沿的处理能力,并通过基于NBI-TCH的损失函数设计加快解集的收敛以及改善解集的分布,获得比DRL-MOEA性能更优的解集。
其他文献
在高速发展的互联网时代,出现了海量多媒体数据。然而,数字图像在数字化处理、存储、传输、复制等过程中都可能受到不同类型、程度的质量损失,因而影响到人们视觉感受。图像质量评价(Image Quality Assessment,IQA)技术旨在学习一个回归模型,从而自动地预测指定图像的质量评价分数。这不仅为筛选高质量图像提供了极大的便利,同时在许多应用中发挥着不可或缺的作用,如:图像搜索引擎、图像修复、
植入式医疗设备在监测人体生理信息、数据传输和药物输送等方面发挥着越来越重要的作用。目前,大部分的植入式医疗设备是由电池供电,电量耗尽就需要通过费用高昂的手术重新更换电池,而无线能量传输技术则为其提供了一种新的供电方法。通过微波辐射方式来实现无线能量传输的优点是可以支持长距离供电,且使用的传输天线要比感应耦合方式采用的线圈尺寸小很多。植入式天线作为射频能量收集系统中的一个关键器件,其性能的优良也直接
随着人口老龄化进程加快,养老需求持续激增,同时城市进入存量发展阶段,大量闲置物业成为城市进一步发展的重要资源。在城市存量更新与养老需求激增的双重因素叠加驱动下,国家通过一系列政策引导闲置房屋建筑进行适老化更新。在此背景下,如何恰当适宜地对存量物业进行适老化更新,成为加快城市更新和满足养老服务需求的关键内容。本文以广汽集团存量物业为研究对象展开了适老化更新研究。首先研究了存量物业及适老化的相关进展,
冷凝冷却设备按照冷却介质的不同主要分为空冷式、水冷式和蒸发式。其中,蒸发式冷凝冷却设备相比于空冷式具有较高的传热系数,而相比于水冷式又可大大降低循环冷却水用量,同时它还具有结构紧凑、初投资小、能耗小等诸多优点。随着国民经济的高速发展,资源的紧缺使节水节能的要求日益突出,蒸发式冷凝冷却设备越来越广泛地被应用在石油、化工、冷藏、食品、建筑等各种领域中。蒸发式冷凝(冷却)设备主要依靠液膜与空气间的传热传
随着电力电子技术的发展和应用,电力系统正呈现明显的电力电子化发展趋势,其谐波污染和中高频振荡问题日益显现,严重威胁系统安全稳定运行。准确检测中高频振荡的参数对于有效抑制中高频振荡至关重要,在线宽频量测有助于监测电网宽频信号的动态情况,能够为中高频振荡的分析提供有效的数据支撑。此外,电力电子化电力系统中包含了大量含有高次谐波和间谐波的宽频信号,如何从含有大量信息的宽频信号中辨识出中高频振荡是一个难点
新能源电动汽车减速器是汽车动力系统重要的组成部分,减速器齿轮传动系统的动态特性对整车综合性能有着重要的影响。该系统有复杂的支承系统,包括壳体支承刚度和非线性轴承刚度,输入转速范围大,在不同的工况下,轴承刚度不断变化,进而对齿轮传动系统的动态特性产生影响。同时,齿轮时变啮合刚度是齿轮传动系统最重要的内部激励之一。因此,有必要对减速器齿轮传动系统的动态特性进行深入分析,探究壳体支承刚度、轴承刚度和齿轮
近年来,基于深度学习的目标检测算法快速发展,诞生了许多优秀的目标检测模型,这些模型可以被分为两大类,一类是一阶段目标检测模型,另一类是二阶段目标检测模型。这两类模型都有一个相同的特点,就是利用水平候选区域来对输入图像中的目标对象进行检测,但这个特点对于充满了密集排列、体积小且朝向任意的目标对象的应用领域不太友好,尤其是产品缺陷检测领域,水平边界框不仅不能准确地表示目标对象的位置,且会使得目标检测模
随着现代社会的不断发展,飞机已经成为越来越多人的出行选择。面对持续增长的民航旅客运输量,航空公司需要增设更多的航班线路来满足民众的需求。由于我国目前的飞行人员较为紧缺,如何能够充分发挥机组成员的最大效益成为解决关键。不合理的排班计划可能会导致飞行人员疲劳驾驶,不仅影响成员的工作状态,而且还会降低飞行质量,为民众出行埋下安全隐患。因此,优化航班与机组成员之间的资源分配对于民航业的高质量发展具有重要意
裂褶多糖是一种中性β葡聚糖,具有抗肿瘤、免疫调节、抗炎及保湿等多种生物活性。然而,分子量大、粘度高、干燥后复溶性差的特性限制了裂褶多糖在工业上的大规模应用。本研究对裂褶多糖进行硫酸酯化改性,通过红外、紫外、核磁(Nuclear magnetic resonance,NMR)等表征其结构,并进一步评价其α-葡萄糖苷酶抑制活性、抗凝血活性、保湿活性,为硫酸酯化裂褶多糖(sulfated schizop
弧菌病是虾养殖过程中面临的主要威胁。目前,还不清楚弧菌是如何穿透富含几丁质的虾壳和胃肠道,进而侵入虾宿主的过程。几丁质酶是一类能水解几丁质β-1,4糖苷键的糖苷水解酶,长期被认为是弧菌的重要毒力因子,但缺少直接的证据。本课题从虾生活环境出发,筛选获得一批具有降解几丁质能力的微生物,其中包括弧菌属细菌,实验评估了几丁质降解菌的降解能力。课题针对得到的虾类主要病原细菌(三株不同种的弧菌):溶藻弧菌、哈