论文部分内容阅读
运输在整个物流业中占有很重要的地位,成本占物流总成本的35%-50%,占商品价格的4%-10%,控制运输成本对物流总成本的节约具有举足轻重的作用。随着信息技术不断发展,新技术应该在物流业得到广泛运用。通过使用现代信息技术,可以提高物流企业的运输调度管理能力,提高物流行业的服务水平,降低运输成本,从而提高物流企业的竞争力。对于不确定物流运输调度问题,现在的解决方案主要存在以下三大问题:第一,对于人工智能和大数据等新兴技术的使用还比较滞后;第二,求解确定型物流运输调度问题时经常使用的启发式智能寻优算法,并不适合用于不确定物流运输度调度问题中;第三,为使用传统启发式算法而建立的不确定物流运输调度模型,往往约束条件很多,十分复杂。本文致力于研究将一类新型的智能算法(深度强化学习算法)应用于不确定物流运输调度系统中。从物流企业经济效益的角度出发,根据不确定物流运输调度问题的实际情况建立多个车辆路径问题模型,并利用深度强化学习算法及其改进算法对不确定物流运输调度问题模型逐个进行求解。本文主要工作如下:(1)研究单配送中心不确定物流运输调度问题,并建立模型。提出利用基于指针网络的深度Q网络对该模型进行求解,通过仿真实验可得到具有可行性的物流运输调度策略。仿真结果表明,该算法在求解精度和稳定性方面优于常见智能寻优算法,证明该算法求解不确定物流运输调度问题有效可行。(2)研究多车型不确定物流运输调度问题,并建立模型。同样使用指针网络作为深度学习的方法,提出使用带基准线的REINFORCE算法对模型进行求解。通过仿真实验可得到具有可行性的物流运输调度策略。仿真结果表明,带基准线的REINFORCE算法求解多车型不确定物流运输调度问题可以得到精度更高的解,证明是一种具有实际应用价值的方法。(3)研究带时间窗的不确定物流运输调度问题,并建立模型。提出运用基于指针网络的演员-评论员算法对该模型进行求解。通过仿真实验可以得到可行的物流运输调度策略。最后通过实验仿真证明基于指针网络的演员-评论员算对于求解带时间窗的不确定物流运输调度问题具有良好的效果。(4)研究多配送中心不确定物流运输调度问题,并建立模型。提出使用基于改进指针网络的演员-评论员算法对模型进行求解。通过对指针网络模型的修改,使之更加适合用于本章建立的输入比较复杂的模型。通过仿真实验可以得到可行的物流运输调度策略。最后的实验仿真结果表明,基于改进指针网络的演员-评论员算法可以很大程度上提高复杂输入情况下算法的求解效率,证明是一种有效的改进。本文的创新点是建立了适用于深度强化学习算法的不确定物流运输调度问题的数学模型,并采用指针网络作为深度Q网络、带基准线的REINFORCE算法和演员-评论员算法等深度强化学习算法的深度学习网络,求解不确定物流运输调度问题。经实验表明,运用本文提出的方法均得到了较好的求解结果。