基于深度强化学习的城市信号灯控制模型设计与实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户：facekr

【摘要】

：

【作者】

：

陈昕宇

【机构】

：

苏州大学

【出处】

：

苏州大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着我国经济的迅猛发展,城市内车辆数量急剧增加。私家车在给人们带来出行便利的同时也不可避免的带来了一些问题,其中最为严重的便是交通拥堵。部署在城市路口的信号灯能够直接影响交通流的行驶趋势,因此优化城市信号灯控制模型是缓解拥堵最有效的方法之一。信号灯控制策略优化从本质上来讲是序列决策优化的问题,由于强化学习能够在与环境的交互中优化决策,因此将强化学习应用于信号灯控制领域具有非常可观的前景。针对上述分析,本文的主要研究内容为基于深度强化学习的信号灯控制问题,希望利用深度学习强大的预测能力和强化学习独有的交互能力,对信号灯控制模型进行优化。本文首先针对单个路口的信号灯控制问题进行了研究。由于传统的深度强化学习算法在预测结果上存在偏差的问题,本文通过自适应调节的权重系数对两种经典的基于值的深度强化学习算法进行结合,使得预测结果更加准确,并将该模型应用于单个路口的信号灯控制系统上,使得信号灯控制策略更加精准,减少车辆等待时间。此外,在上述模型中,为了对路口状态进行准确的表示,本文利用注意力机制自动学习交通流中各个特征对于状态表示的重要程度,从而使得状态表示更加准确。接着,对于多个路口的信号灯控制策略的优化问题,本文利用图注意力网络学习路网中相邻路口对目标路口决策的影响,使得多个路口之间的交通流信息能够彼此传递,协调控制多个路口的信号灯,从而提高整个城市中道路的通行能力。利用仿真软件,本文分别在真实数据集和仿真数据集上进行了实验,实验结果表明本文的方法有效的减少了车辆等待时间,一定程度上缓解了交通拥堵。本文的研究成果对于基于深度强化学习的信号灯控制系统的研究工作具有一定的参考意义。此外,本文在上述研究的基础上还实现了一个基于深度强化学习的信号灯控制系统,该系统为训练信号灯控制模型提供了可视化的支持。

其他文献

我国薪酬保密解雇合法性之探究

自我国实施社会主义市场经济以来,我国市场与国际市场融合程度与日俱增,企业经营管理体系也愈发现代化。与此同时,许多“舶来”的企业管理制度在此过程中被引进,薪酬保密制度就是其中之一。所谓薪酬保密,就是一种禁止员工和其同事讨论各自劳动报酬的工作场所规则或薪酬管理制度。企业实施这一制度的根本目的在于,通过限制或阻断薪酬信息的传播以维护企业内部稳定和提高经济效益。然而,这项制度在为企业管理带来利好的同时,也

学位

面向推理类问题的机器阅读理解及其鲁棒性研究

机器阅读理解（Machine Reading Comprehension,简称MRC）是一项针对给定文本和特定问题自动生成或抽取相应答案的问答任务,该任务是评估计算机系统对自然语言理解程度的重要任务之一。目前已有大量开源机器阅读理解数据集发布,且现有的阅读理解模型已在非推理类数据集（如:SQuAD,TriviaQA等）上取得了与人类可比甚至超越人类的性能表现。但在考验模型推理能力的数据集（如:Ho

学位

面向单图像超分辨率的多尺度卷积神经网络模型研究

随着互联网和多媒体设备的普及,图像已经成为信息承载和传播的主要媒介。通常,图像分辨率越高,图像质量就越好,也越能表现出更多的细节。目前的硬件设备和图像采集过程制约了部分场景下高分辨率（High Resolution,HR）图像的生成,从而影响了对这类图像处理的处理效果。因此,使用算法重建HR图像已经成为图像处理和计算机视觉领域的研究热点之一,最为基本的算法是单图像超分辨率（Single Image

学位

面向生物医学领域的句子级事件抽取研究

随着生物医学领域的发展,相关文献资料呈现出指数级增长的趋势,如何快速高效地从大量生物医学文献中提取出有价值的信息和知识已成为一个亟待解决的问题。生物医学事件抽取任务是从生物医学文献中自动抽取出生物事件,并以结构化的形式表示出来。本文对生物医学事件抽取任务进行研究,主要内容包括:（1）基于流水线方式的生物医学事件抽取。本文使用先进的预训练语言模型实现了一个基于流水线的生物医学事件抽取框架。该框架将生

学位

基于外部知识的场景图生成研究

场景图生成任务是一项新兴的计算机视觉任务,生成图像内容的结构化表示,缩短图像处理和理解间的语义差距,具有广泛的应用前景。针对VG（Visual Genome）数据集失衡问题,论文从知识图谱（ConceptNet）中分别引入类别相关、局部结构和全局结构的外部信息提高生成场景图的质量。主要工作内容如下:（1）针对类别相关语义信息不足的场景图偏置问题,提出了外部信息引导和残差置乱的生成方法。该方法引入与

学位

残差引导的图像超分辨率重建技术研究

图像超分辨率重建目的是提高图像空间分辨率、改善视觉效果,具体包括一般重建技术和插值技术。现有算法可分为基于图像自身信息的算法和基于外部数据的学习算法,后者能够从外界获得先验信息,从而生成高质量的图像。本文围绕“混合模型”和“随机森林”两种学习类算法开展研究,并提出重建效果更佳的算法。图像中一般都会存在大量相似的局部结构。基于这一事实,学习类的重建算法将配对的高、低分辨率图像块作为输入,按照“先聚类

学位

基于多粒度和交互敏感的隐式篇章关系识别研究

隐式篇章关系识别任务旨在根据句法信息、语义信息和上下文信息等线索推理论元对之间的篇章关系。该任务因缺乏显式连接词等直接推理线索,需依赖论元充分的语义表示帮助推理,是自然语言处理领域中一项基础且颇具挑战的任务。本文为挖掘论元更丰富的语义表示,基于宾州篇章树库v2.0,提出了基于多粒度和交互敏感的隐式篇章关系识别研究,主要包括三个部分:第一部分是短语级表示学习方法。短语信息因为天然的语义内聚性,是识别

学位

基于Transformer预训练模型的语言特征分析及其应用

预训练模型的出现将自然语言处理带入了一个新的时代。对多种自然语言处理任务,借助预训练模型取得的性能已经远超过传统的方法。然而,目前预训练模型的可解释性较差,对句子语义的捕获能力还有待进一步分析。AMR（Abstract Meaning Representation,抽象语义表示）是一种基于图结构的语义表示方法,能够提供句子级别精准的语义表示。AMR与预训练模型作为有机整体相辅相成。一方面,借助AM

学位

医学图像中肋骨骨折检测与分类算法研究

近年来,随着计算机技术的发展和人工智能的兴盛,人们对于计算机视觉的研究也进一步深入,在工业、军事、交通等领域都取得了长足进展,其中以医学领域的技术革新最为引人注目。肋骨骨折作为一种常见骨科疾病,主要通过相关医疗设备对患者胸腔肋骨的医学图像进行采集,最后由医生根据影像进行诊断。在借助机器学习、深度学习方法后,医疗设备可以提取肋骨骨折图像的特征并在此基础上实现初步判断。作为现代医疗辅助技术的重要工具,

学位

认真学习《习近平著作选读》持续把习近平新时代中国特色社会主义思想学习宣传贯彻引向深入

＜正＞《习近平著作选读》第一卷、第二卷出版座谈会5月22日在京召开，中共中央政治局常委、中央书记处书记蔡奇出席会议并讲话。他表示，编辑出版《习近平著作选读》是党中央作出的重大决定，是党和国家政治生活中的一件大事，要把学习选读作为坚持用习近平新时代中国特色社会主义思想凝心铸魂的重大政治任务，推动把学习宣传贯彻习近平新时代中国特色社会主义思想和党的二十大精神引向深入，引导广大党员干部更加深刻领悟“两个

期刊

基于深度强化学习的城市信号灯控制模型设计与实现

与本文相关的学术论文