基于深度强化学习的单交叉口交通信号控制方法研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:hdy_123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着汽车数量的持续增长,交通拥堵已经成为世界各国城市发展中出现的公共问题。尽管道路设施建设能够在一定程度上缓解交通拥堵,但是会受到成本、土地、时间等因素的制约,建立智能交通信号控制系统是解决该问题最经济和有效的办法之一。本文将深度强化学习方法应用到单交叉口信号控制中,提高车辆通行效率。论文的主要工作如下:(1)将Q学习和浅层神经网络结合并应用到单交叉口信号控制中。根据车辆排队数定义交通状态,用浅层神经网络拟合Q函数,讨论了两种不同奖励定义方法之间的区别。通过实验证明了基于浅层神经网络的Q学习信号控制方法优于定时控制和最长队列先行这两种经典的信号控制方法。(2)研究了基于深度Q学习的单交叉口信号控制方法。根据车辆位置重新定义交通状态,引入深度卷积神经网络取代之前的浅层神经网络,加入经验回放技术提高算法的稳定性。实验结果表明,在相同交通环境中,基于深度Q学习的信号控制方法的车辆通行效率得到提升。(3)考虑车辆长度之间的差异,对基于深度Q学习的单交叉口信号控制方法进行了改进,提出两种新的交通状态表示方法。另外,智能体在进行动作选择时,利用模拟退火策略取代之前的ε贪婪探索策略,缩短了算法的训练时间,提高了算法的收敛速度。(4)研究了基于深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法的单交叉口信号控制方法。提出新的信号相位执行策略,在每个决策点输出下一相位的执行时间。实验结果表明,相比于基于深度Q学习的信号控制方法,由于基于DDPG算法的信号控制方法输出的相位执行时间可以是连续的,因此车辆平均延误时间更短,车道平均车辆排队数更少。
其他文献
固体氧化物燃料电池(SOFC)是目前发展在科研前列的一种新型燃料电池,连接体是SOFC中的关键组件之一。随着中温SOFC技术的不断成熟,铁素体不锈钢应用于连接体材料已经一种成为可能。但是,在SOFC的工作环境中,铁素体不锈钢表面会不断发生氧化。随着氧化时间的延长,铁素体不锈钢表面Cr2O3膜逐渐增厚,连接体的面比电阻会不断增加;同时,Cr2O3膜发生转变成为CrO3(g)或CrO2(OH)2(g)
本文考虑汽车4WS(Four Wheel Steering)系统在极限工况下的局限性,提出汽车4WS和ESP(Electronic Stability Program)系统协同控制来使4WS汽车在极限条件下更加稳定。由于路面状况对汽车4WS与ESP系统的工作效果的影响较大,本文采用扩展卡尔曼滤波法对路面附着系数进行估计,并用MATLAB编程验证了此方法的有效性。并基于不同的路面附着系数进行了 4W
牙种植体的稳定性是提高种植体的使役寿命的关键。在牙种植体系统中,基台是连接上部牙冠与下部种植体之间实现抗旋防松的关键结构,由于在日常咀嚼时基台-种植体内连接会经常受力扭转,并且植入操作有扭矩的要求,基台-种植体连接需要保证足够的抗扭转和变形的能力,才能更稳定和耐用,连接结构对种植体系统整体稳定性具有重要影响。同时,种植体系统承受长期的咀嚼力后会出现松动和折断等机械并发症,探究种植体系统疲劳性能内在
随着人类对海洋的探测需求越来越多,多种多样海洋探测设备也得到快速的发展。水下拖曳体(Underwater Towed Vehicle)作为一种水下探测设备,具有结构简单、模块性强、造价低、作业范围不受自身能源限制等优点,近年来得到了快速的发展与应用。无人水面艇(Unmanned Surface Vehicle,简称USV),是一种体积较小的海上无人平台,具有机动性好、作业隐蔽的优点,是目前国内外研
随着我国经济的不断发展,人们生活水平的日益提高,旅游度假成为了人们追求生活品质、释放精神压力的全新生活方式。房车旅游,作为一种新兴的度假形式,也逐渐受到年轻人的追捧。然而,与欧美等发达国家较为成熟的发展体系相比,国内房车的发展起步较晚,仍处于初期阶段,相关研究不足。我国房车行业存在着改装公司数量少,改装质量良莠不齐,成品房车售价较贵且难以满足用户的个性化定制需求等问题。为解决以上问题,本文引入模块
磁流变液阻尼器因其优异的阻尼可调性、快速响应时间、阻尼调节范围大、低能耗等特性,而拥有着巨大的应用潜力。然而由于磁流变液存在的一些尚未完善解决的稳定性与使用寿命问题,目前磁流变液阻尼器并没有得以广泛地应用。本文针对磁流变液阻尼器中磁流变液的沉降问题进行了探索,提出了在阻尼器设计时在结构上采取防沉降设计的方法,在制作了一款采用该防沉结构的磁流变液阻尼器的基础上展开研究。本文的研究对磁流变液阻尼器的更
改革开放以来,我国宽厚板生产技术装备及生产工艺得到了迅速发展,宽厚板材产品产量大幅度提高,但是低档次的普通宽厚板产品已趋向饱和,甚至过剩。为了满足开发高等级钢材,有必要投建辊式淬火机。本文以沙钢5000mm热处理淬火机为依托,通过构建其一级自动化系统及工艺控制系统,并通过现场实际情况分析影响钢板淬火板形的因素,成功地应用在新开发的低合金压力容器钢07MnNiMoVDR上,取得了良好效果。主要研究内
全断面硬岩隧道掘进机(Tunnel Boring Machine,简称TBM),是一种隧道施工专用的大型设备。TBM刀盘作为TBM的核心部件,具有开挖岩石、稳定掌子面的作用。TBM在工作过程中,由于岩层地质的复杂性、操作状态的多变性及岩石破碎的随机性,致使TBM刀盘经受着各种复杂随机载荷。在这些随机载荷的反复作用下,刀盘就会产生疲劳失效,严重影响了 TBM的工作效率和使用寿命。为了保证TBM工作效
随着全球石油向低质化、高硫化方向发展,高硫石油焦消化能力接近饱和,新增加的产能无处释放。我国利用高硫石油焦的方式大部分为燃烧,不但对能源造成浪费,还会对空气造成污染。在我国节能减排的大形势下,进行石油焦气化是一种很好的工业发展思路。既可以解决石油焦的利用问题,也可以补充我国的天然气与氢能资源。而传统无催化剂石油焦气化工艺获得的天然气或氢气体积分数较低,且需要高温高压的环境。而在石油焦气化过程中加入
传统的生物酶是一种具有生物催化作用的高分子聚合物,作为一类天然的生物催化剂,他们具有催化效率高、专一性强等优点,但是由于生物酶的组成结构复杂、环境耐受性差和价格昂贵等缺点局限了其应用,因此研究具有生物酶特性的人工合成材料十分必要。近些年来,金属有机骨架材料作为一种新型的有序多孔晶体材料,因为其固有的高比表面积、结构组成多样以及可修整等特性而吸引了研究者们的广泛的关注。本论文利用双金属有机骨架与氮化