论文部分内容阅读
随着城市化进程的持续加速,城市交通拥堵问题日益严峻,而城市公共交通具备低能耗、大容量等特点,大力推广公共交通的优先发展可有效减缓城市交通拥堵。近年来,我国政府明确表示,加强公共交通管理是我国城市发展的紧要环节,推进城市公共交通的优先发展,以提升城市公交系统的综合服务水平,缓解城市交通拥堵和资源环境压力。另一方面,人工智能及车联网技术的发展与融合,推动了传统交通逐渐转变为智慧交通的进程,同时也为公交优先发展提供了更为灵活的途径。本文主要研究基于深度强化学习的公交优先信号优化控制策略。以交叉口与交通信号控制器构成的闭环控制系统为研究对象,基于深度强化学习算法,提出了一种公交优先信号优化控制策略并应用到真实的交通场景中,同时利用SUMO(Simulation of Urban Mobility)交通仿真平台来搭建实验环境。基于实际交通场景的仿真结果表明,本文所提出的方法可有效实现公交车辆的优先通行。本文主要开展的工作内容如下:1、通过对典型交叉口公交车辆的运行效率进行实例评估与分析,提出本文公交信号优先的研究目标。然后,对公交优先控制模型与算法进行了深入研究,为构建公交优先信号优化控制策略提供了理论基础。2、提出了基于改进深度强化学习的单点交叉口公交优先信号优化控制策略。首先,从安全、全局效益及节能三方面考虑,设计了公交优先信号控制问题的时间边界约束条件,然后,建立了公交优先信号优化控制模型。其次,对DQN(Deep Q Network)算法的结构进行调整和改进,从而提升算法训练速度。最后利用交通系统仿真软件SUMO进行仿真实验,以Webster方法计算得出的定时信号控制方案作为对比实验,结果表明,本文所提出的优化控制策略可使公交车辆和全部车辆的平均延迟分别下降30%和15.38%,通行能力分别提升16.67%和14.29%。此外,为进一步验证该方法的控制效果,本文以福州市的一个单点交叉口作为实例交通场景,验证了本文方法可有效降低公交车辆的平均延迟。3、提出了基于改进深度强化学习的多智能体区域多交叉口公交优先信号优化控制策略。在单点交叉口公交优先信号优化控制策略的基础上,通过分析区域多交叉口中相邻交叉口交通状态的相互影响关系,构建了针对区域多交叉口的多智能体深度强化学习协同信号控制策略。与定时信号控制相对比,本文方法的区域多交叉口公交车辆的平均延迟平均降低了23.89%,通行能力也平均提高了22.19%,同时部分交叉口社会车辆的平均延迟和通行能力也有较好的效果,这表明了本文算法可较好地实现针对区域多交叉口的公交车辆优先通行。