基于分层的深度强化学习求解旅行商问题

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:Mywillz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
旅行商问题是经典的组合优化问题,在交通调度、物流管理、芯片设计等领域都具有重要的现实应用。因此,该问题自从上世纪被提出后就广受研究者的关注,但旅行商问题作为NP难问题,不存在多项式时间的求解算法。传统求解旅行商问题的算法分为精确算法、近似算法和启发式算法。近年来,随着深度学习在计算机视觉、自然语言处理等领域取得成功,研究者尝试利用深度学习技术来求解旅行商等组合优化问题,以期在组合优化领域也取得突破。现实应用场景中的很多旅行商问题实例具有规模大、时效性强的特点,但现有的深度强化学习算法都无法处理大规模问题。为解决这一个实际需求的瓶颈问题,提出了一种新的分层式深度强化学习算法,分为两层进行交替训练来快速求解大规模旅行商问题。上层算法负责生成子问题和合并子问题的解,其中提出了一种使用k-近邻图和广度优先搜索来动态生成子问题的方法。子问题被定义为具有固定端点的开环旅行商问题,这类问题的解是一条开环路径,可以直接合并为一个完整的旅行商问题路径。下层算法负责求解上层算法生成的子问题,使用基于深度强化学习方法训练的自回归求解器。该求解器的主体是一个编码器-解码器结构的深度神经网络模型,能够对节点数据进行编码,并直接输出节点序列构成的路径。另外,采用了数据增强和片段优化技术这两种在求解阶段能够提升算法性能的增强优化策略,能够通过更长的计算时间换取解的质量优化。分层式深度强化学习算法在四个不同规模的随机分布的数据集上进行了实验测试。实验结果表明,该方法能够快速地得到大规模旅行商问题的较优解,解的质量与最优解之间的差距为个位数百分比,并且所需的求解时间相比几个基准算法要低一至两个数量级。另外,分别对分层深度强化学习算法中的一些关键技术进行了消融实验,验证这些技术在算法中的重要性。
其他文献
随着云计算、物联网、大数据等新兴业务应用普及,数据中心作为云计算的核心基础设施,其计算能力和内部数据交换能力呈现出指数级增长趋势。为应对数据流量快速增长的需求,新一代短距光互连系统向着高速率、大容量方向发展。受光纤色散和器件带宽制约,进一步提升开关键控(On Off Keying,OOK)信号速率遇到瓶颈,利用高波特率高阶调制信号可以满足速率提升的需求。四电平脉冲幅度调制(4-level Puls
学位
Mura指平板显示器像素矩阵上出现的不完美、不均匀现象。自动光学检测技术因其快速、精准、稳定的特点在平板显示器的自动化生产中被广泛应用。对于数量庞大、种类繁多的Mura缺陷,本文引入基于卷积神经网络的Faster R-CNN目标检测算法,试图提高传统机器视觉算法的准确度和检测效率。针对Mura缺陷图像样本中存在背景噪声和亮度不均匀问题,利用Gabor滤波器组对图像纹理背景进行抑制,并利用独立成分分
学位
氨气引发的雾霾污染问题正逐渐引起人们的关注。具有大比表面积的二维材料MXene在氨气气敏和吸附方面展现出巨大潜力。然而,当前针对MXene吸附氨气的研究仍只停留在极少数案例上,且对吸附的机理尚无规律性的研究。本文基于第一性原理计算,研究了一类MXene材料(M2CO2)对氨气的吸附能,主要研究内容如下:计算了6种M2CO2(其中M=Ti、V、Zr、Nb、Hf与Ta)对氨气的吸附能,确定了稳定的吸附
学位
成像光学系统是帮助人们观察世界的工具,随着如今科技的发展,对光学系统的要求也逐步提高。离轴反射系统相对于常用的折射和折反射式系统,有着无色差,使用波段广,大视场,大口径以及体积小等优点,具有良好的应用前景。文章主要从像差理论入手,分析离轴反射系统中存在的离轴矢量像差,用以指导后续离轴反射系统的设计优化。并引入光线追迹方法,分析赛德尔像差系数与系统中各反射面之间的联系,以此进行初始结构的设计。在光线
学位
为了减小传统Si基MOSFET器件缩小到纳米级别时小尺寸效应造成器件特性退化的影响,适应后摩尔时代异质集成的发展需求,可以通过选取具有更高载流子迁移率的Ge作为沟道材料,设计更合理的器件结构以及采用性能更优异的栅介质材料等方法实现突破。本文从实验和模拟仿真两方面开展工作。实验方面首先围绕不同堆栈栅结构分别制备了Ge/Al2O3,Ge/Al2O3/Hf O2和Ge/Al2O3/Hf Al O三种MO
学位
随着信息技术的高速发展,各类电子产品为人们的生活与工作带来了极大的便利,而电源作为驱动这些电子设备的动力源泉,承担着信息社会基石的作用。如今,伴随着高速通信、电动汽车和智能制造等技术的长足进步,宽输入范围高效率的Buck型直流-直流(Direct Current to Direct Current,DC-DC)变换器也逐渐成为集成电路行业的研究热点:它不仅能够满足不同应用场合对输入输出电压的要求,
学位
‘赣彤2号’是由樟树实生苗中选育出的新品种。叶片内折,春季新叶橙红色,成熟叶浅绿或绿色;夏季新生叶为浅黄色,成熟后转浅绿色、绿色。春季初生枝粉红色且有稀疏白色斑点;夏季初生新枝黄色、有红色斑点且有紫色基环;10月下旬枝条半木质化后鲜红色。
期刊
在知识经济时代下,城市与区域的发展动力越来越依赖知识这一关键变量,使得知识密集型产业被赋予由知识、技术引领下的创新发展使命。其中,知识密集型服务业(KIBS)以知识和信息等非实体产品的传播、交易为等特征,是承载城市经济功能的重要产业。KIBS产业倾向于在空间上集聚以获取更大的竞争优势,这种集聚所形成的区域既集聚了众多KIBS企业,又汇集了大量的城市知识与创新资源,对于城市内部的培育新兴产业增长极培
学位
随着互联网技术的高速发展,各类应用所产生的数据量呈爆炸性增长趋势,对海量数据存储有着越来越高的需求,同时也促进了分布式数据库的快速发展。TiDB是一款新型分布式数据库,具有分布式水平弹性伸缩和多副本数据安全等重要特性。然而TiDB拥有比单机数据库更多更复杂的性能参数,默认配置并不能适应所有分布式应用场景,且手工配置合理的参数难度很大,因此对其进行自动参数性能调优具有很重要的实用价值。针对上述TiD
学位
随着经济结构的转型,第三产业占比不断提升,社会消费品总额逐年增加,消费对于未来经济增长具有至关重要的作用,特别是在以国内经济大循环为主导的背景下,提升国内消费被进一步提高到国家战略地位。近年来,多目的、体验式的购物成为主流,城市居民的消费行为在空间与时间上都呈现多元性与规律性。作为消费活动发生的核心地区,商业中心内消费活动随时间的变化对城市的日常运转影响较大,因此,开展消费活动时变模式及其影响因素
学位