强化学习及其在城市交通信号控制中的应用研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:try111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通拥堵已经成为现代社会中城市及其周围区域普遍存在的问题而且越来越严重,交通信号控制作为调节交通网络中交通流的主要方式,所以优化交通信号控制是解决交通拥堵问题行之有效的方法。由于交通流具有高度的动态性和随机性,又因为交通信号控制问题本身是一个顺序决策问题,所以将强化学习应用到交通流控制是较合适的。将交通信号控制系统看成交通网络中所有交叉口控制器Agent组成的分布式的多Agent系统,并将强化学习方法应用到这个多Agent系统,设计并开发基于强化学习的交通信号控制方法来实现自适应交通控制是解决交通拥挤和交通拥堵的主要方法之一。在本文的研究中,首先,对基于模型的强化学习在交通信号控制中的应用进行了探索和研究。本文改进TC1交通信号控制方法而给出了TCSG交通信号控制方法。TCSG方法通过考虑车辆长度进而合理计算车辆的目的车道的拥堵信息实现了多个交叉口控制器Agent的协作。通过在GLD中进行大量的仿真实验表明,TCSG方法优于TC1方法。其次,对模型无关的强化学习在交通信号控制中的应用进行了探索和研究。设计和实现了DMFQ交通信号控制方法、QSGWE交通信号控制方法、DMFQV交通信号控制方法,DMFS交通信号控制方法和SSGWE交通信号控制方法,它们都采用基于车辆的建模方法来解决以前的基于模型无关的强化学习的交通信号控制方法的状态空间爆炸问题,实现了多交叉口控制器Agent的共享协作,采用“等待投票机制”预测并选择每个交叉口控制器Agent的最优动作。在GLD中进行了大量仿真实验表明,它们优于定时信号控制方法和TC1方法。最后,对本文的研究工作进行了总结,指出本文研究的问题和不足之处,然后对未来的研究工作给出了意见和展望。
其他文献
随着城市化进程的加快和机动化的快速增长,城市交通供给的增加远跟不上交通需求的增长,城市交通供需不平衡性日益明显,交通拥挤成为一种必然现象,仅依靠道路基础设施的建设已难满
【正】 文革前,我下乡的机会比较多。已记不清是哪一年了,也许是1966年春吧,我来到了与浙江接壤的上海郊区——枫围公社。出乎意料地在那里参加了一次别开生面的茶会。枫围周
期刊
徐迟20实际30年代的诗歌中的地理意象存在三种形态,即以自我为中心对自然地理的平面观察,因而诗中的地理意象以平面形态出现;以对中国、世界与宇宙三位一体空间的立体观察,因
采用有限元分析软件Dynaform,对某汽车副车架的内高压成形工艺进行数值模拟。研究不同初始管坯尺寸和内压加载路径对壁厚分布和零件成形质量的影响。分析结果表明,合理的初始
<正>当血钾水平>5.5mmol/L时临床即诊断为高钾血症[1],这是尿毒症患者较为常见的并发症,也是常见致死原因之一。当血钾>6.5mmol/L时即要急诊血液透析。血液透析是治疗高钾血
作为高中数学三大思想方法之一,学习并熟练掌握划归思想对高中数学的学习非常有帮助。而函数是高中数学中的重难点,更需要应用划归思想,将复杂的问题转化成简单的问题。因此,
随着计算技术的提高、新型材料的运用和施工技术的进步,桥梁向大跨、轻质方向发展,稳定性及抗风方面的问题日益突出。分布在沿江沿海和山区峡谷地段的大跨高墩连续刚构桥高墩上
<正>为积极应对老龄化,实施了17年的《老年人权益保障法》在2012年被全面修订并经十一届全国人大常委会第三十次会议审议通过。新的《老年人权益保障法》第5条第2款规定:"国
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
给排水系统是建筑物中非常重要的环节之一,不仅为人们的生活提供了便利,而且提高了建筑行业的技术水平,在建筑施工中,给排水施工的好坏直接影响了建筑物的质量水平和使用功能