交叉口信号控制模型与基于深度学习的优化方法研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户：haohailinbo

【摘要】

：

【作者】

：

王锋

【机构】

：

北京交通大学

【出处】

：

北京交通大学

【发表日期】

：

2023年01期

【基金项目】

：

国家自然科学基金创新群体项目“城市群综合交通系统管理理论方法”（批准号:71621001）；国家自然科学基金重点项目“城市交通供需结构演化机理与调控方法”（批准号:51338008）；

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

城市交通是城市的重要组成部分,是居民衣、食、住的有力保障。随着国民经济的发展和城市化进程的加快,我国机动车保有量急剧增加。机动车保有量的迅猛增长,加剧了城市交通拥堵程度,交通安全和交通污染等问题也日益严重。道路交通拥堵以及由此形成的其他危害,已成为大多数城市面临的“城市病”之一,城市交通问题在一定程度上已成为制约经济和城市可持续发展的瓶颈。通过提升当前交通管理水平,充分利用现有道路资源,使用先进的控制技术和协调方法,提高路网运行效率以缓解拥堵是目前最经济和可行的方案。在交叉口设置等待区是一种我国城市普遍采用以提升通行能力、缓解交通拥堵、抑制过饱和状态的做法,然而针对等待区的研究仍不够深入。另外,过往建立数学优化模型以提升交叉口性能的方法可能已经达到“理论极限”,基于机器学习的方法和技术已经在很多领域中取得成功,因此,开展基于强化学习和深度强化方法的交通控制理论与方法的研究,是提升交通管理水平,提高交通通行效率,缓解交通拥堵,提升居民交通出行满意感的前提。本文立足于交通控制的基本理论与方法,对等待区的设置和车辆运行特性、过饱和交叉口的信号优化等问题进行分析,并对深度强化学习方法在信号优化领域的应用开展研究。首先,分析评述了国内外过往的相关研究,结合我国国情,确定了本文的研究思路、研究方法和技术路线;第二,在分析过饱和交通流运行特性的基础上,利用图解分析法,建立了过饱和状态下的延误模型,并以平均延误最小为优化目标,推导了适合过饱和交叉口的信号周期优化模型;第三,使用交通冲突理论对广泛应用于国内大、中等城市的等待区的设置方法、车辆启动特性等进行分析,建立了有等待区交叉口通行能力模型,并提出了适用于等待区交叉口的信号优化策略和方法;第四,在深入分析强化学习和深度强化学习方法的基础上,选择排队长度作为状态空间,将过饱和交叉口的信号优化问题转化为马尔科夫决策过程,由此提出了基于强化学习方法的过饱和交叉口信号优化方法,并搭建了训练-测试平台,验证了所提方法的有效性;第五,依据干线交叉口协调控制理论与方法,确定其状态-动作关系,提出了一种类似于k臂赌博机优化问题的分布式干线交叉口协调方法,使用神经网络进行状态梯度下降,并利用训练-测试平台对一条包含5个交叉口的城市干线进行测试,结果表明,本文所提方法优于数学解析法。本文的主要研究成果包括:（1）引入连续型延误模型建模方法,通过刻画车流到达-驶离规律,建立了基于图解分析方法的过饱和交叉口延误模型;考虑整个过饱和时段,构建了以平均延误最小化为目标的周期优化模型。实证分析验证了该模型的有效性,案例表明,该模型可降低车辆行程延误4.22%、停车延误7.58%。（2）从交叉口交通冲突关系角度,结合驾驶员行为特性,提出了等待区的设计方法;使用对比分析方法,将等待区对车辆启动过程和清空过程的影响进行了量化建模,并引入HCM通行能力模型建模方法,构建了有等待区交叉口通行能力模型;针对过饱和交通状态,提出最大化通行能力的优化策略,针对低饱和交通状态,提出两种降低交叉口延误的优化方法;仿真结果表明:针对未饱和状态的两种优化方法都可以减少交叉口的平均延误,分别可以减少交叉口延误5%-11%和10%-14%。（3）借鉴离散型延误模型建模分析方法,揭示了Bang-bang控制策略减少交叉口延误的运行机理,并建立了基于平均延误模型的奖励函数;通过刻画强化学习算法优化过程和马尔科夫决策过程（MDP）,以交叉口排队长度作为状态空间、以绿信比作为动作空间,将过饱和交叉口信号优化问题转化为MDP,并提出了基于Q-learning和Double DQN的过饱和交叉口信号优化方法;通过设置不同的约束条件和惩罚因子,避免车辆溢流现象;使用Python语言和Tensor Flow工具包搭建了训练-测试平台,并对两相位和多相位交叉口进行了训练和测试。仿真实验表明,两种优化方法可以有效降低过饱和交叉口的平均延误;无排队约束条件时,两种方法可以实现与两阶段Bang-bang控制方法一致的优化效果,并且最大排队长度减小1.7%,有排队约束时,最大排队长度减小约13%;同时,所提基于Double DQN的优化方法比基于Q-learning的优化方法有更好的适应性。（4）通过分析干线交叉口协调控制的优化机理,确定将交叉口距离、系统速度、周期时长、上游交叉口相位差等关键参数作为系统状态,将当前交叉口相位差作为动作;由于这一状态-动作对相互影响过程难以转化为MDP,提出了一种类似k臂赌博机优化方法的分布式学习算法;由于创造性的将上游交叉口的相位差引入状态空间,并将交叉口上行车辆和下行车辆的加权平均停车率作为奖励函数,实现了双向分布式协调优化。以郑州市的一段包含5个交叉口的主干路作为实证案例,利用Vissim仿真软件和Python编程语言搭建了训练-测试平台;测试结果表明,基于深度学习算法的分布式干线协调优化方法优于数学解析法,整体停车率降低3%-37%,并且,分布式协调方法具有更好的适应性和可扩展性。

其他文献

在情境体验中学习寓言——以统编版语文三年级下册寓言单元教学为例

＜正＞体验式教学法在教学实践中的运用越来越普遍。对不擅长抽象思维的小学生而言，这种教学法有助于他们直观、具体地理解课堂所学内容。在语文课堂教学中，如何实施体验式教学法呢？笔者结合统编版语文三年级下册寓言单元的教学，谈谈具体做法。

期刊

基于羟基硅酸镁的纳米颗粒制备及其摩擦学性能研究

随着机械设备的运行工况向着高速、重载方向发展以及人们环境保护意识的日益增强,作为润滑油添加剂的纳米颗粒在摩擦学领域的研究受到了各国研究人员的广泛关注。蛇纹石是一种层状硅酸盐矿物,其主要化学成分为羟基硅酸镁MSH。MSH的人工合成及其相关材料在润滑油抗磨添加剂领域的研究与应用不仅有利于克服天然矿物的杂质不确定性等缺点,而且有望解决现有商用润滑油抗磨添加剂二烷基二硫代磷酸锌的环境污染问题。类金刚石膜是

学位

地下管廊燃气泄漏扩散规律及通风系统风险评价方法研究

地下综合管廊是实现市政管线统一管理的有效方式,能够解决“空中蜘蛛网”和“道路拉链”问题,近几年在我国大规模建设。由于刚刚兴起,缺乏数据信息和工程经验,只是照搬规范进行设计,但规范内容的合理性并未验证,并且作为高危管道的燃气管道也被要求纳入到综合管廊当中,独立成舱。燃气管廊是地下综合管廊中一个独立的受限空间,一旦燃气管道发生泄漏,后果不堪设想,明确事故通风对廊舱内燃气泄漏扩散规律的影响十分必要。作为

学位

低功耗反向散射通信系统下的信号检测与性能分析

近年来物联网快速发展,各类感知设备呈指数级增长,由此引发的能量供应问题和频谱竞争问题将制约物联网的大规模部署和应用。低功耗反向散射通信技术的出现为物联网带来了新的机遇。基于低功耗反向散射通信技术的无源反射设备能够将环境中的射频（Radio Frequency,RF）信号作为能量来源,利用无线能量传输技术进行无线充电,延长物联网设备的生命周期。同时,环境中的RF信号也作为载波信号,供无源反射设备通过

学位

基于异质网络的中药靶点预测及应用研究

中药及由中药组成的复方是中医独具特色的临床干预方法,也是当今社会实现慢性复杂性疾病个体化诊疗的重要治疗手段。以揭示中药复方微观药理机制为核心任务的中药现代化研究一直是中医药研究的重要课题,对推动中医药学术和临床诊疗水平发展具有重要作用。但由于中药成分的多样性和复杂性（单味中药的成份）,中药的药理作用往往通过多靶点途径发挥效应。因此,采用传统药理实验方法,进行中药药理机制特别是中药靶点的确认存在诸多

学位

高耐磨贝氏体车轮钢组织调控与性能研究

贝氏体钢因其良好的强韧性匹配及优异的抗接触疲劳等综合性能成为下一代高性能车轮用钢的潜在材料。探究贝氏体钢磨损失效机制、改善其耐磨性能成为车轮材料研究的热点之一。本论文以自主研发的贝氏体车轮钢为对象,探究了车轮钢显微组织与磨损性能间的关系,并通过显微组织调控的方法进行了车轮钢耐磨性能改善的研究。论文主要内容包括车轮钢成分及相变特征、组织性能关系、耐磨性能改善及车轮工业生产试制、重载线路服役等。对贝氏

学位

高速列车通过路隧过渡段的横风效应及其控制方法研究

与无风环境相比,高速列车遭遇强风作用时列车气动力特性将发生显著变化。近些年来,我国高速铁路逐渐向地形复杂、风环境恶劣的中西部地区延伸。为了更好地满足高速铁路的线路要求,隧道、桥梁等基础设施不可避免,不同类型基础设施相连的情形将非常普遍。目前,国内外针对隧道气动效应及强风下高速列车通过桥梁、路堤时列车气动特性的研究已取得诸多成果,而对强风下高速列车通过路基-隧道、桥梁-隧道过渡段时气动效应的研究较少

学位

空间目标特征提取与识别关键技术研究

深空探测是世界科技发展的前沿,对揭示地球起源、人类起源、引领科技发展具有突出作用,是具有基础性、前沿性、创新性的科研领域。2007年,嫦娥一号绕月飞行是我国向深空探测进军的起点,2020年,嫦娥五号成功实现月球采样返回是我国深空探测取得重大技术突破的里程碑。2021年,“天问一号”火星着陆巡视器成功着陆火星。未来还将开展以小行星和彗星为目标的深空探测任务和空间逼近,停泊、维护等在轨服务工程实施工作

学位

微结构光纤特性及器件研究

近年来随着云计算、物联网、智慧城市等多业务的快速发展,高带宽、低时延的需求将导致通信行业发生一系列新的变革。其中光网络的发展将以传输承载功能为根本、超高速传送与接入为动力、全光网络的智能化为目标。本论文依托国家重点研发计划课题“微结构光纤集成器件”和国家自然科学基金项目“新型光电子器件”,重点研究了微结构光纤特性及全光纤结构器件的应用。论文针对限制型和泄漏型两类微结构光纤,对大模场面积、抗弯曲、空

学位

微波光子信号生成、混频及检测技术研究

微波信号生成及处理在雷达、通信、电子对抗等领域发挥着重要的作用。基于电子技术的传统微波处理技术受限于“电子瓶颈”,在宽带、高频等应用中已经无法满足需求。本文利用微波光子技术大带宽、低损耗等特性,针对近年来的研究热点和问题,结合光电振荡器（OEO）、非厄米量子力学等相关内容,对高质量微波信号生成,微波光子宽带混频和微波光子信号检测等关键技术进行了理论研究和实验验证。本文主要工作内容如下:1.频率稳定

学位

交叉口信号控制模型与基于深度学习的优化方法研究

与本文相关的学术论文