【摘 要】
:
城市交通拥堵浪费大量通行时间,严重加剧了尾气排放,造成经济损失。通过合理规划道路网络的交通流量,交叉路口的交通信号控制(Traffic Signal Control,TSC)能够有效地缓解交通拥塞,因此在解决交通拥堵问题上,交通信号控制饰演了重要角色。由于交通信号控制本质上是序列决策问题,目前大多数研究利用多智能体强化学习(Multi-Agent Reinforcement Learning,MA
论文部分内容阅读
城市交通拥堵浪费大量通行时间,严重加剧了尾气排放,造成经济损失。通过合理规划道路网络的交通流量,交叉路口的交通信号控制(Traffic Signal Control,TSC)能够有效地缓解交通拥塞,因此在解决交通拥堵问题上,交通信号控制饰演了重要角色。由于交通信号控制本质上是序列决策问题,目前大多数研究利用多智能体强化学习(Multi-Agent Reinforcement Learning,MARL)模型进行交通信号控制研究的工作,由单个交叉路口的交通信号控制扩展到多个路口的全局控制,并取得了一定的成果。但是,现有的研究仍然存在不足。首先,现有的城市交通仿真环境不具备真实性,无法贴近真实世界的交通状况,导致无法保证实际道路测试的有效性。其次,现有的关于MARL的交通信号控制的大多数研究都集中在设计有效的通信方法,但忽略了智能体(Agent)在合作通信中如何互动的重要性,Agent之间的通信在MARL交通信号控制中的研究还不够深入。最后,现有的交通信号控制算法大多数处于经济利益考虑,极少考虑生态交通理念。针对上述问题,本文以单个交叉路口的交通信号控制研究为切入点,深入基于深度强化学习的多交叉路口交通信号控制研究,展开了详细的研究并取得了如下成果:(1)本文针对现有的交通仿真软件进行了对比,对SUMO仿真平台进行二次开发,包括构建合成和真实交通路网构建,然后基于交通管理部门公开的某时段交通流量数据,在SUMO中对真实的车流量进行设置,构建了贴近实际物理场景的大规模城市路网交通仿真环境,为实际交通信号控制问题在理论研究中提供实验保障。(2)针对单交叉路口的TSC问题,本文提出了Fuel-ECO TSC模型以提高孤立交叉路口的通行效率。该方法利用深度强化学习(Deep Reinforcement Learning,DRL)技术以实时感知高维的交通状态,并有效地调整交通信号控制策略。在Agent设计中描述了用于控制多目标交通信号的TSC策略,并且,基于改进的自适应交通信号控制策略,该方法为接近的车辆提供最佳的速度曲线,以平滑交通流并提高车辆的燃油经济性。(3)针对多交叉口的TSC问题,本文构建了图协作Q学习交通信号控制模型(Graph Cooperation Q-Network Traffic Signal Control,GCQN-TSC),图协作注意力使得Agent可以根据动态的交通流量信息实时调整自己的关注度,在更大范围内快速有效地感知交通环境。并且,在该模型中提出了DGQ(Deep Graph Q-Learning)算法,提取不同交通场景的时空特征,为每个交叉口提供最优的信号相位。同时,本文创造性地把生态交通理念融入MARL交通信号控制中,致力于减少交通尾气排放。最后,利用SUMO交通仿真实验平台进行的实验结果表明,GCQN-TSC在平均排队长度和等待时间等性能指标上都优于其他交通信号控制方法。
其他文献
基于“创新、协调、绿色、开放、共享”五大发展理念,通过对高质量发展及信息产业发展评价指标体系的梳理,从创新驱动、协调发展、开放水平、竞争优势4个维度构建了包含9个二级指标、16个三级指标的信息产业高质量发展评价指标体系,以2009-2020年为研究时段,采用熵值法测算山东省信息产业高质量发展综合得分,对山东省信息产业高质量发展趋势进行分析。以山东省信息产业高质量发展综合得分为被解释变量,以技术创新
第三人震惊损害通常被认为是在损害事故发生时或者发生之后较为短暂的时间内,第三人即被害者以外的人,因为目睹事故发生的经过或者嗣后知悉事故发生的情节导致其受到严重精神刺激而导致的精神崩溃的极端痛苦情绪。目前我国法律制度对于第三人震惊损害赔偿责任尚未明确规定,致使法院在审理此类案件的过程中易出现“同案不同判”的现象。研究探讨第三人震惊损害赔偿责任的法律认定、明确第三人震惊损害具有可赔偿性的实践意义、探寻
相比传统硅基器件,Si C(碳化硅)MOSFET依托宽禁带半导体材料的优势,在高压、高频、高温等领域有着更为广阔的发展前景,器件特性、驱动设计、短路保护已成为目前关注的热点及难点。电力电子装置内部功率器件击穿或控制失效时,将导致多个器件处在短路回路中,形成复杂的串联短路。阐述单个器件短路特性的文献很多,但缺少对功率拓扑结构中串联短路的分析。本文在掌握Si C MOSFET基本特性的基础上,以桥臂串
自TiO2电极在紫外光照射下实现水分解制氢,半导体光催化技术被认为是解决能源危机和减少次生环境最有效的途径之一。然而,其大的带隙和极低的太阳能利用率导致析氢能力有限。继TiO2等一系列氧化物光催化剂之后,二维光催化剂获得了广泛关注。其中,二维MXenes材料具有超高的载流子迁移率和合适的带隙,在光催化水分解领域展现出巨大的潜力。但是,二维MXenes的光生电子-空穴对极容易发生复合,严重抑制了在光
当下,随着生活水准的提高,旅行开始进入越来越多的人的生活,无论是为了追求更好的生活品质,还是为了缓解都市生活的压力,或者是为了体验各种生活的美景。现代国民的消费水平越来越高,互联网行业迅速发展,各项技术有效提升,在线支付等条件也逐渐成熟,传统的旅游行业也不断开始加入互联网因素,使得在线旅游行业迎来了利好的发展契机,在线旅游平台也正在迅速崛起。作为一种新型的线上商业模式,在线旅游不断受到大众的重视,
滇西彝族历史悠久,民族文化底蕴深厚,尤以楚雄彝族刺绣工艺技艺较为凸显,其民间刺绣工艺是彝族民俗民风和历史文化的物质载体,也是彝族人民长期依据自然环境、民俗习惯和经济生活等所创造的非物质文化遗产。彝族彝绣较好的保留了彝族的生存状态、原始风貌和文化体系,具有浓厚的地域文化特色。艳丽丰富的彝族刺绣色彩,以最直观的视觉感观呈现彝族人民的审美观念、民俗风情、思想表征,它具有强烈的装饰意向、丰富的文化内涵和民
可靠性评估的重要性体现在产品的设计、研制、生产、使用等各个阶段。由于齿轮泵具有高可靠、长寿命的特点,往往退化数据少且存在多种不确定性。针对上述问题,在不确定理论框架下,从一元和二元性能退化可靠性评估这两个方面展开研究。基于振动数据构建退化评估指标。提出了基于ICEEMDAN和豪斯多夫距离的降噪方法,通过仿真信号验证该方法的有效性。在计算时域、频域及复杂度特征基础上利用主成分分析法进行多特征融合,得
无人直升机技术由于涉及多学科的融合使得其具有很高的智能化水平,因此近年来我国加大了对无人直升机领域的研究力度。交叉式无人直升机具有稳定性更好、悬停效率更高、诱导阻力较小等优点,该构型无人直升机可广泛应用于装备补给、目标监视、电力巡检、环境监测、铁路测绘等军民两用领域。因此,开展交叉式无人直升机的总体设计对后续开展该构型直升机的研究具有重要的指导意义。论文首先对无人直升机发展进程和研究现状进行了阐述
随着新冠疫情席卷全球以来,慕课突破了时间和空间的局限,为现代教育提供了优质的服务和资源。许多教学团队将本土慕课配以英文翻译,使之变为国际性慕课。这不仅为中国文化与外界文化沟通搭起了桥梁,还能提高中国国际话语权。本报告围绕昆明理工大学2020年承办的慕课翻译项目展开,所选材料来自昆明理工大学生命科学与技术学院提供的慕课《基因工程》中六个视频的中文文稿。2020年7月,该项目圆满结束。直至今日,《基因
水运行业的飞速发展促使水域交通流密度日益增大,水上交通日趋繁忙。交汇水域作为水上交通的重要组成部分,承担着联通水运网络的重要作用,其交通情况更加复杂。厘清交汇水域船舶交通流特征,实现交汇水域船舶交通流的安全、高效组织,有助于提升水运效率。因此,本文以交汇水域船舶交通流的安全性与通航效率为目标,基于强化学习展开交汇水域船舶交通组织研究。本文的主要内容及研究成果如下:(1)本文通过研究、总结交汇水域船