基于单智能体强化学习的交通信号控制方法研究与应用

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:cxy153
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市规模的发展以及人口的持续增加,交通拥堵成为亟待解决的热点问题。而交通信号作为调节和优化交通流的最主要方式,使用智能手段进行交通信号控制是改善交通拥堵的有效方法。目前的交通信号控制多是使用静态调节方法,通过人为分析车流数据来对道路中交通信号灯的配时和周期时长进行固定设置,虽然在使用初期能一定程度上缓解交通压力,但由于缺乏动态分析和决策,在应对不同的道路情况时无法实时调整,无法从根本上提升交通信号的效率。车流分析和交通信号控制的问题的本质上来说是一个包括环境分析和机器决策的问题,非常契合强化学习的适用范围。本文提出的基于单智能体强化学习的交通信号控制方法,使用单一智能体(Agent)处理多个路口的车流数据,动态地给出当前车流情况下最优的交通信号灯配时方案。首先,使用路口车辆属性的稀疏矩阵和仿真截图作为车流数据的状态描述,并使用卷积神经网络提取特征、选择最优动作。其次,针对多路口的车流数据关联影响问题,本文采用单Agent处理多路口数据并在神经网络中共享参数来解决,既减少了多Agent引起的计算复杂,又能由自动地考虑多路口协作。再次,本文引入了对偶学习,双Q学习,优先级经验重放等提升强化学习性能,通过在仿真软件SUMO(Simulation of Urban MObility)中的实验证明了其有效性。最后,本文给出了一种基于深度强化学习的交通信号自动控制系统,能够根据图形化界面中的配置进行仿真训练。
其他文献
目的:建立安徽医科大学附属妇幼保健院妊娠期促甲状腺素(Thyriod stimulating hormone,TSH)、游离甲状腺素(Free thyroxine,FT4)及甲状腺过氧化物酶抗体(Thyroid peroxidase antib
池塘工程化循环水养殖系统通过集约化形式,整合空间资源,实现小面积的集中养鱼、大面积生态化净水,并配套实时在线监测水质网络系统、废物处理装置和气提推水增氧装备以及绿
目前,我国经济正处于“新常态”的结构调整以及改革的重要阶段,其特征主要体现为经济增长驱动因素、社会融资结构以及经济增速发生重大改变。在这个时期,由于金融创新步伐的
员工在工作过程中的人际关系、工作环境、工作内容等方面的满意程度会影响到企业的绩效。因此,企业要想得到绩效的可持续发展,就需要多关注员工的满意度对企业绩效的影响以及两者之间的路径传导机制。以F石化公司为实证研究对象,对该问题进行深入的研究。F石化公司连续九年跻身中国化工行业500强,但是近两年利润下降,绩效不佳,由于员工满意度对企业绩效的提升有促进作用,因此从员工满意度角度出发,对如何影响企业绩效以
目的:1.探究胎儿颈项透明层(nuchal translucency,NT)增厚与遗传学异常的相关性。2.探索本中心预测胎儿不良结局的NT适宜截断值。方法:第一部分:回顾选取2014年07月至2018年02月因胎儿NT增厚(NT>95th)于我院行介入性产前诊断的病例247例,染色体微阵列分析(chromosomal microarray analysis,CMA)为一线遗传学检查方法,分析
随着人们环保意识的增强和化石能源的日益枯竭,新能源汽车成为未来汽车的发展方向。混合动力汽车由于兼具传统燃油车续航里程长和纯电动汽车环境友好的优点,是目前汽车新技术
叶酸(Folic acid,FA)是机体一碳代谢循环中重要的甲基供体,在DNA合成、稳定性及修复中起关键作用。FA缺乏会导致DNA碱基错配、缺失、DNA链和染色体断裂等基因组不稳定性(Geno
制造业量大面广,能耗总量大,是工业领域能源消耗的主体。制造系统能效问题已成为世界制造业可持续发展的重要研究热点之一。柔性加工系统是在现代制造模式下发展起来的一种以
中国心脑血管患病及死亡率逐年攀升,占居民疾病死亡构成的40%,住院总费用每年超过千亿。建立以患者为中心,以高血压、血脂异常等危险因素管理为突破口的全程综合防治管理模式
塑料制品自产生以来就以其可塑性强、轻便、价格低廉等特质极大的便利了公众的生活,并在生产生活的方方面面得到广泛的使用。正是基于塑料制品的惊人生产量与使用量,加之它使用过后的不当处理,塑料废弃物的累积也是天文数字,引发了严重的“白色污染”问题,给人类赖以生存的环境带来了极大的压力和严重的破坏。近些年来电商、快递行业的高速发展,再一次将塑料废弃物所引发的“白色污染”推上风口浪尖。虽然“白色污染”防治工作