基于深度强化学习的交通灯区域控制方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:eric73384
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着中国现代化建设的稳步前进,城市化进程的不断加快,机动车的数量也随之大幅增加,交通拥堵已经成为各大城市普遍存在的问题。随着互联网科技的发展,人工智能、大数据、深度强化学习等技术成为研究的热点,相关技术被广泛应用于交通灯控制领域。为解决交通拥堵问题,寻找更加合理的交通灯控制算法提供了新的技术支持。由于交通流特性复杂,路网规模庞大,因此将路网划分为若干个独立的子区域进行控制是必然的结果。准确的交通预测模型能够对接下来的交通状况更好的进行预判,对于结合当下和未来的交通情况,制定合理的交通灯控制算法具有重要意义。本文针对现有的交通灯控制算法存在的不足之处进行优化,结合子区划分和流量预测,提出了一种基于深度强化学习的交通灯区域控制方法。主要研究内容如下:首先,对子区划分在交通信号控制中的作用进行了探索和研究。针对传统子区划分算法仅考虑道路静态属性的问题,对传统Newman快速算法进行改进。通过综合考虑交通流量、路段长度、交通流密度、排队长度、信号周期,计算交叉口之间的关联程度,实现了对路网的动态划分。通过实验证明基于改进Newman快速算法的动态控制子区划分方法优于传统Newman快速算法,可以实现路网子区动态划分,且结果更加符合交通流特征。其次,针对现有相关研究中基于神经网络的交通流预测方法,没有充分考虑交通流的空间特征以及计算复杂度较高的问题,通过将CNN网络与GRU网络相结合,建立了一种新的交通流预测模型。首先使用CNN网络提取交通流的空间特征,然后使用GRU网络提取交通流的多种时间特征,最后对预测结果进行融合。实验表明,基于CNN和GRU网络的交通流预测算法优于传统LSTM预测算法,能够提高预测准确率。最后,针对现有的信号控制算法没有很好解决多交叉口协同控制,且控制策略具有一定的滞后性的问题。提出了一种结合流量预测的Double DQN交通灯区域控制方法。首先使用子区划分算法决定交通灯协同控制的区域范围,然后利用流量预测算法提高控制策略的前瞻性,最后通过基于Double DQN的交通灯区域控制方法实现了对多交叉口的协同控制,仿真实验证明,在轻度交通流和重度交通流环境下,算法均能降低车辆的等待时间。提高路网的通行效率,保障路网的畅通。
其他文献
环境分权是政府实行环境公共治理的一项重要制度安排,以实现政府内部有效划分环境公共品供给责任为目标。在环境分权制度下,中央政府负责统一制定环境政策及环境标准,地方政
党的十九大报告明确指出,中国特色社会主义进入新时代。我国社会主要矛盾发生了历史性的改变,为解决新时代社会的主要矛盾,我国必须推进国家治理体系和治理能力现代化。而国家治理的重要保障是财政收入。2018年的中央经济工作会议明确提出,要实施积极的财政政策,并进一步加力提效,要进一步落实落细减税降费政策。新时代的减税降费有别于传统意义的减税降费。新时代的减税降费是聚焦于长期经济发展的制度安排,而传统意义的
全球化和数字化将物流和供应链产业带入一个全新时代。物流作为货物运输的重要环节,在当前激烈的市场竞争中面临新的挑战。面对时代变革,运输公司的角色也需要进行调整,以满足客户日益变化的要求。因此,为了能够在竞争激烈的市场竞争中生存和发展,企业市场营销策略的制定至关重要,良好的营销策略是企业提高竞争优势的重要手段。营销策略的制定成为企业发展的一个重要问题。本文对哈萨克斯坦KTZ Express JSC公司
随着传感器技术和信号处理的进步,传感器网络在社会生产生活中的应用得到了快速发展。在传感器网络的数据分析和处理任务中通常涉及大量的结构化数据,其中结构承载着有关于数据性质的关键信息。在实际应用中,网络中的拓扑结构与由硬件节点之间的几何距离构建的结构明显不同,因此必须估计出节点之间潜在的结构,以便对传感器网络中的数据进行有效表示、处理、分析或可视化。在这种情况下,一个关键的任务是推断一个可以描述传感器
交通运输行业主要的货物运输方式有内河航运、公路运输以及铁路运输。长期以来,内河航运都是交通运输行业的重要组成部分。长江上游航道是连接东西部的重要水运通道,长江上游航运一直以来对长江上游的货物运输作出了重大贡献。随着长江上游航道建设取得的较明显成果,在长江上游地区,航道担任的货物运输比例也在不断加大,关乎着长江上游经济的发展。本文分析了长江上游地区的运输现状,总结了三种运输方式的基本特点,初步认为货
翁文灏是中国近代历史上首位地质学博士。他学贯中西,在海内外学术界享有盛誉。更为重要的是,他长期担任南京国民政府资源委员会和经济部负责人,实际上是国民政府工矿业建设的决策者与实践者。因此,学者和官员的双重身份使得他的工矿业建设思想不仅具有特殊的理论研究价值,更能给现实的改革和发展提供参考和借鉴。本文从中国近代所处的历史环境入手,以时间为线索,梳理了翁文灏在全面抗战爆发前、战时、战后的国营工矿业思想。
在日益发展的通信系统中,随着技术的不断进步,对于能够满足大容量、多功能、超宽带的需求的天线越发迫切,天线的可重构成为天线重要的研究课题。全息天线由于其低剖面,能够实现集成化,且基本不需要额外的馈电结构这些优势赢得了多方关注,但是根据全息理论可以发现,全息结构在确定之后,其辐射的方向角度往往是固定的,因此实现全息天线的可重构有着较高研究价值。本文首先分别对国内外全息天线及可重构天线的研究情况进行了介
烯烃是化学、化工生产中最重要的原料之一,通过烯烃的官能团化反应可以合成多种化学中间体和功能性骨架。由于烯烃的立体构型影响着生理和化学活性,因此高度区域、立体选择性的烯烃合成方法一直是有机合成化学领域的重点研究内容之一。本论文作者通过筛选、设计和合成合适的配体,发展了高效的钴催化芳基烯烃E式选择性异构化反应,主要工作包括以下两部分:(1)钴催化β-取代芳基烯烃的E式立体选择性异构化反应。在二苯胺双膦
反馈是指在教师提问后,针对幼儿回答做出的言语或非言语的反应和处理行为。在幼儿园语言教学活动中,教师的反馈行为对发展幼儿的语言表达能力、提高幼儿的思维水平和塑造幼儿的性格特点具有重要作用。反馈既够能实现良好的师幼互动,也能够体现教师的教学智慧。目前,有关幼儿园领域教师反馈行为在语言教学活动中的研究比较匮乏。本研究选择锦州市X幼儿园的6名教师为研究对象,通过观察法、访谈法和案例分析法了解幼儿园教师在语
光催化有机反应与常规反应相比,具有环境友好、反应条件温和等优点,其体系已成功应用于各种化合物的合成。目前,常用的光催化剂多为金属络合物及有机功能染料,但存在回收利用难、环境污染等问题,因此,设计开发可重复使用的光催化剂是光催化领域的一个重要研究方向。本文选用腈纶纤维,通过胺化改性-玫瑰红RB吸附,制备了可见光催化纤维,在优化制备工艺、表征纤维结构的基础上,研究了其在交叉脱氢偶联反应中的催化活性,分