基于强化学习超启发算法的不确定车辆路径问题鲁棒优化

来源 :浙江工业大学 | 被引量 : 1次 | 上传用户：f372286882

【摘要】

：

随着信息技术的飞速发展,人们越来越关注现代化物流产业。信息技术与物流产业的结合,催生了一系列利用大数据及人工智能技术的现代化物流运输与配送产业。实际中,运输与配送

【作者】

：

冯勤炳

【出处】

：

浙江工业大学

【发表日期】

：

2020年01期

【关键词】

：

不确定车辆路径问题强化学习鲁棒优化超启发算法数据驱动

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的飞速发展,人们越来越关注现代化物流产业。信息技术与物流产业的结合,催生了一系列利用大数据及人工智能技术的现代化物流运输与配送产业。实际中,运输与配送环节,客户的需求时时在变化,潜在客户也会随时间、地点的变化出现或者消失。如何提升客户的满意度,提高物流企业的潜在利润,具有重要意义。经典的车辆路径问题(Vehicle Routing Problem,VRP)以车辆运输中的各种因素为条件,找寻最短距离的路径规划方案,是物流运输配送领域的研究热点。为了规避运输中各种因素的不确定性,对VRP问题的拓展——不确定车辆路径问题(Vehicle Routing Problem with Uncertainty,UVRP)进行研究,基于数据驱动,鲁棒优化不确定模型,提高客户满意度,降低物流运输配送成本。本文针对UVRP中的VRPUD(Vehicle Routing Problem with Uncertain Demand)、VRPUC(Vehicle Routing Problem with Uncertain Customers)问题和鲁棒优化的方法,在分析其理论发展和实际意义的基础上,进行模型和算法方面的研究,建立UVRP模型,分别设计基于强化学习的超启发算法求解。研究工作主要包括以下几个方面:(1)首先总结了不确定性问题上的鲁棒优化方法。研究并综述了鲁棒优化的研究现状,以及车辆路径问题上鲁棒优化的应用。分析了鲁棒优化在车辆路径问题上应用的不足之处。对鲁棒优化的两大类模型——未知分布信息的关于集合的鲁棒优化模型和已知部分分布信息的分布式鲁棒优化模型进行总结,提出利用数据驱动降低鲁棒保守程度的必要性。(2)设计了基于DQN(the Deep Q Network)的强化学习超启发算法,并成功求解CVRP(the Capacitated Vehicle Routing Problem)问题。在超启发算法的高层选择策略中,首次结合DQN的强化学习算法,对底层算子的性能进行奖惩评价;接受准则中利用奖惩值以及模拟退火相结合,采用对优质解建立序列池的方法,引导算法更有效地搜索解空间。利用聚类思想提升初始解的质量。对CVRP的标准算例进行计算,并与其他算法对比。实验结果证明了所提算法在CVRP求解上的有效性和稳定性,总体求解效果优于对比算法,为下文基于强化学习的超启发算法的研究作铺垫。(3)研究了基于数据驱动的多车型VRPUD鲁棒优化。引入客户需求不确定参数,建立不确定模型。将不确定模型转化为具有可调整参数的鲁棒模型,同时利用数据驱动中的最小二乘法结合历史数据样本,设计了与需求最大值、需求范围、所给车型载重量有关的鲁棒可调整参数的函数,优化鲁棒模型。改进适合于FMVRP(the Feet size and Mix Vehicle Routing Problem)基于DQN的强化学习算法,求解鲁棒模型。通过测试实验,证明设计的鲁棒优化模型在该问题上,能有效减少受不确定性影响的客户,极大地提高客户的满意程度,有效减少总成本,改进后的算法也具有较好的效果。(4)研究了基于数据驱动的VRPUC分布式鲁棒优化。引入客户需求服务为随机概率的不确定参数,建立不确定客户的车辆路径模型,同时利用分布式鲁棒优化方法优化不确定模型。结合数据驱动中的核密度估计方法,拟合历史数据样本的分布特征集合,优化鲁棒模型。设计高层基于Q-Learning算法的强化学习算法,求解上述模型。通过实验计算,证明了上述分布式鲁棒模型在该问题上,相较于确定性方法,在保证客户满足度的同时,有效减少了总成本,降低鲁棒保守性。

其他文献

基于领域术语的中文问题自动生成技术

面向领域的中文问题生成对于企业和学校进行教育培训与知识考核具有重要意义。通过领域专家进行手工出题的传统方法已经不能满足日益增长的教学培训需求。随着自然语言处理技

学位

中文问题生成领域术语依存句法分析深度学习自然语言处理

银企关系、资产可抵押性与融资约束

近年来,我国正加紧推进全面深化改革的进程,我国的综合国力逐渐增强,实现了从站起来、富起来到强起来的历史性飞跃。能够实现这样的飞跃,与我国的经济实力不断提升是密不可分的。而我国经济实力的提升,与我国的企业能够得到有效发展是密切相关的。任何一家企业要想实现持续、稳定地发展,都是需要企业内部和外部共同努力、配合。因此企业的发展既需要企业内部的有效运营,也需要外部环境能够满足企业的需求条件。根据企业现金流

学位

融资约束银企关系资产可抵押性

基于粒子滤波和极限学习机的非线性机电系统故障诊断和预测

在现代工业生产中,随着机电系统的自动化程度和结构复杂性不断提高,工业生产和应用过程中机电系统发生故障的可能性大大增加,而机电系统的故障往往会导致系统停机或者设备损

学位

非线性机电系统双重因果键合图模型基于生物地理学优化的粒子滤波优化极限学习机故障诊断退化趋势预测剩余使用寿命估计

联萘酚衍生物用作毛细管电色谱手性固定相的研究

R-联萘酚是一种具有轴手性的化合物,在合成中经常用为手性源来合成一系列的衍生物。用R-联萘酚所合成出来的衍生物大多数都溶于有机溶剂,因此将其用作毛细管电色谱的固定相效

学位

联萘衍生物色谱固定相毛细管电色谱手性拆分

非平稳干扰下光纤振源检测的虚警控制算法研究

油气管道的安全运输需要先进的检测技术和控制策略作为保障。在非平稳干扰下,光纤振源检测的虚警控制对振源检测的准确性和社会安全的防护都有重要的意义。随着光时域反射定位方法、恒虚警检测方法的发展,光纤预警技术的应用日益成熟。由于单级检测系统会造成虚警分布形状突变,考虑到输出的虚警一般不服从高斯分布,本文提出检测信号虚警的概率密度函数(Probability density function简称PDF)形

学位

光纤振源检测虚警PDF权动态模型PDF形状控制

基于BP神经网络的无人艇航向控制研究

无人艇是一种在水面上快速航行的小型船只,拥有着安全、经济、高效等优点,从而在军事和民用领域得到了广泛的应用。在海洋领域越来越为重要的背景下,无人艇的应用范围较大,并

学位

无人艇航向控制PID控制BP神经网络

牛病毒性腹泻病毒NS4B蛋白与宿主互作蛋白的筛选鉴定

牛病毒性腹泻-黏膜病(Bovine viral diarrhea,BVD)是由牛病毒性腹泻病毒(Bovine viral diarrhea virus,BVDV)感染引起的病毒性传染病,主要感染牛,表现为呼吸系统、消化系统疾病和致死性黏膜病,对世界养牛业造成极大的危害,引起国内外学者对于BVDV致病机制研究的重视。研究表明BVDV非结构蛋白(Non-structrual protein)4B在病毒

学位

牛病毒性腹泻病毒NS4B蛋白酵母双杂交cDNA文库构建Bak1蛋白

2-二芳基吲哚甲醇的转化反应研究

本论文以2-二芳基吲哚甲醇为底物,在温和反应条件下实现了底物的选择性C-H键双官能化,C-H键官能化/环化串联,以及C-O键的转化反应,发展了若干高效构建含吲哚骨架潜在功能分子的合成方法学。本论文的研究内容主要包含以下三个部分:第一部分研究了银促进下2-二苯基吲哚甲醇与亚磺酸钠的反应,区域选择性地实现了 2-二苯基吲哚甲醇的脱羟基/1,7-双磺酰化,合成了一系列含有两个芳基砜结构片段的2-二芳基吲

学位

2-二芳基吲哚甲醇C-H键官能化环化区位选择性亲核取代

基于结构系综理论的Rayleigh-Bénard热对流相似解及传热标度律

Rayleigh-Benard(RB)热对流是在一个封闭腔体中,下壁加热,上壁冷却,四周壁面绝热,在上下温差驱动下形成的流动系统,其边界条件简单,但传热系数努塞尔数(Nu)和运动强度雷诺数(

学位

Rayleigh--Bénard热对流结构系综理论直接数值模拟分离角涡传热标度律Pr数效应

新型N,O-配位1,8-萘啶氟硼化合物的合成、结构、光谱性质及理论研究

1,8-萘啶衍生物广泛存在于许多医药植物中,其萘啶环刚性较强,具有优良的光物理性能、配位能力以及生物活性,使得该类化合物在有机发光材料、荧光传感器、医药学等领域都有应

学位

NO-配位型18-萘啶氟硼化合物光谱性质pH荧光探针密度泛函理论

基于强化学习超启发算法的不确定车辆路径问题鲁棒优化

与本文相关的学术论文