论文部分内容阅读
随着信息技术的飞速发展,人们越来越关注现代化物流产业。信息技术与物流产业的结合,催生了一系列利用大数据及人工智能技术的现代化物流运输与配送产业。实际中,运输与配送环节,客户的需求时时在变化,潜在客户也会随时间、地点的变化出现或者消失。如何提升客户的满意度,提高物流企业的潜在利润,具有重要意义。经典的车辆路径问题(Vehicle Routing Problem,VRP)以车辆运输中的各种因素为条件,找寻最短距离的路径规划方案,是物流运输配送领域的研究热点。为了规避运输中各种因素的不确定性,对VRP问题的拓展——不确定车辆路径问题(Vehicle Routing Problem with Uncertainty,UVRP)进行研究,基于数据驱动,鲁棒优化不确定模型,提高客户满意度,降低物流运输配送成本。本文针对UVRP中的VRPUD(Vehicle Routing Problem with Uncertain Demand)、VRPUC(Vehicle Routing Problem with Uncertain Customers)问题和鲁棒优化的方法,在分析其理论发展和实际意义的基础上,进行模型和算法方面的研究,建立UVRP模型,分别设计基于强化学习的超启发算法求解。研究工作主要包括以下几个方面:(1)首先总结了不确定性问题上的鲁棒优化方法。研究并综述了鲁棒优化的研究现状,以及车辆路径问题上鲁棒优化的应用。分析了鲁棒优化在车辆路径问题上应用的不足之处。对鲁棒优化的两大类模型——未知分布信息的关于集合的鲁棒优化模型和已知部分分布信息的分布式鲁棒优化模型进行总结,提出利用数据驱动降低鲁棒保守程度的必要性。(2)设计了基于DQN(the Deep Q Network)的强化学习超启发算法,并成功求解CVRP(the Capacitated Vehicle Routing Problem)问题。在超启发算法的高层选择策略中,首次结合DQN的强化学习算法,对底层算子的性能进行奖惩评价;接受准则中利用奖惩值以及模拟退火相结合,采用对优质解建立序列池的方法,引导算法更有效地搜索解空间。利用聚类思想提升初始解的质量。对CVRP的标准算例进行计算,并与其他算法对比。实验结果证明了所提算法在CVRP求解上的有效性和稳定性,总体求解效果优于对比算法,为下文基于强化学习的超启发算法的研究作铺垫。(3)研究了基于数据驱动的多车型VRPUD鲁棒优化。引入客户需求不确定参数,建立不确定模型。将不确定模型转化为具有可调整参数的鲁棒模型,同时利用数据驱动中的最小二乘法结合历史数据样本,设计了与需求最大值、需求范围、所给车型载重量有关的鲁棒可调整参数的函数,优化鲁棒模型。改进适合于FMVRP(the Feet size and Mix Vehicle Routing Problem)基于DQN的强化学习算法,求解鲁棒模型。通过测试实验,证明设计的鲁棒优化模型在该问题上,能有效减少受不确定性影响的客户,极大地提高客户的满意程度,有效减少总成本,改进后的算法也具有较好的效果。(4)研究了基于数据驱动的VRPUC分布式鲁棒优化。引入客户需求服务为随机概率的不确定参数,建立不确定客户的车辆路径模型,同时利用分布式鲁棒优化方法优化不确定模型。结合数据驱动中的核密度估计方法,拟合历史数据样本的分布特征集合,优化鲁棒模型。设计高层基于Q-Learning算法的强化学习算法,求解上述模型。通过实验计算,证明了上述分布式鲁棒模型在该问题上,相较于确定性方法,在保证客户满足度的同时,有效减少了总成本,降低鲁棒保守性。