基于深度强化学习的城市道路交通控制算法研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:BNBNBN668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国城镇化率和人均机动车保有量的不断提高,许多城市面临着交通拥堵的困境。近年来随着科技不断进步,大数据、人工智能、深度强化学习等领域的研究不断深入,结合这些新技术的城市智慧交通也成为了研究的热点。此外,城市交通的信息化程度的逐步完善为城市智慧交通的实现提供了数据层面的保障。本文在实现城市交通信号的优化问题上进行了深入的研究,主要的工作分为以下两个部分。在工程层面上,本文分别设计并实现了两个分别基于Vissim和SUMO仿真软件的交通信号控制仿真平台。这两个平台面向强化学习算法进行设计和优化,并且在专业的仿真软件基础上二次开发,提高了仿真实验的可信度。在算法层面上,本文提出了一种基于深度Q网络算法的交通控制算法,利用矩阵表示法对交通状态信息进行提取,对小型路网的联合信号相位进行独热编码作为智能体的动作,论证了深度强化学习算法在小规模网络上进行交通信号控制优化的可行性,并且通过多个实验分析了DQN算法在此领域的优势和局限性;目前针对区域路网的信号控制时往往采用分布式控制方案,其策略协调往往依赖于人工调整,而中心式控制往往受限于动作空间,无法在状态动作空间内进行高效的探索从而学习到良好的策略。针对这一问题本文提出了层次区域控制框架,利用上层策略观察全局信息对各个路口的控制策略进行协调。而下层策略只关注本地路口的信号优化。这种结构结合了分布式控制和中心化控制的优点,缩减了动作空间维度的同时能够有效协调区域路网的交通流。借助层次结构的优势,此方法能够适应规模更大的区域路网并且在算法训练过程中有较好的鲁棒性。此外本文展示了大量的仿真实验,通过对实验过程和结果的分析与总结,本文证明了此方法在典型场景中相比起传统方法取得明显的性能优势。
其他文献
利用微型双向电泳、SDS电泳、免疫印迹法、DEAE-Sephadex色谱、高效液相色谱及氨基酸分析等方法,对牛脊髓(中枢神经)和马尾神经(周围神经)的可溶性酸性蛋白质进行了研究。结
唇腭裂是人类口腔颌面部最常见的先天性畸形疾病。腭裂修复手术会为腭裂患者发出清晰可懂的语音提供生理基础,但术后仍有部分患者会由于腭咽闭合不全或不良的发音习惯出现各种各样的语音障碍,即腭裂语音。本文拟从听辨、声学与鼻化度三方面对腭裂术后腭咽闭合完全组(Velopharyngeal Competency,简称VPC)与腭咽闭合不全组(Velopharyngeal Insufficiency,简称VPI)
排水闸工程是一种常见的水利工程,本文结合湛江某排涝工程排水闸底板大体积混凝土的施工方法进行了探讨。
世界气田分布中,缝洞型碳酸盐岩气藏占有重要的地位。数值试井解释技术利用气藏数值模拟技术的优点,为复杂缝洞型碳酸盐岩气藏的精细描述和评价提供了新的方法和思路,为此类
<正> 赤霉素是一种天然的植物生长调节剂,又称“920”,它对植物生长具有多种生物功能,可以调节植物生根、发芽、结果等过程。能刺激水稻、棉花、麻类等作物的生长发育;因此,
讨论了用模拟退火算法求解矩形件排样问题。在对问题数学模型分析的基础上 ,给出了模拟退火算法求解的关键步骤和方法 ,并通过算例讨论了模拟退火算法中三个主要参数初始温度
《电动摩托车和电动轻便摩托车通用技术条件》(征求意见稿)前不久在网上公布了。其中对电动摩托车和电动轻便摩托车分别作了如下的定义:由电力驱动的最高设计车速大于50km/h的两
岩煤层对比是煤田地质勘探阶段一项极为重要的基础工作,尤其在地质构造复杂.煤层不稳定,含煤层数多,层间距小的云南宣威井田,勘探工作的主要任务之一.就是解决岩煤层对比问题
随着改革开放的进一步深入,国家财政在扶贫工作方面的支出逐年上升,这也从侧面反映了中央对扶贫工作的重视程度。高重视、高投入的扶贫政策带来的是贫困人口的逐年减少和脱贫攻坚战的不断深入。财政扶贫资金作为中央政策落实的载体,直接影响了贫困人口生活的方方面面,对扶贫资金展开全面的、有效的、客观的绩效审计,能够促进政府扶贫部门提高绩效意识。同时,广覆盖的政府审计能够促进财政扶贫资金合规、高效的使用,对于全面完
儿科临床杂病、传染病的诊治,应用清瘟败毒饮治疗传染性单核细胞增多症、手足口病、过敏性紫癜、川崎病等属“热毒深重、气血两燔”之火热病症,取得了良好疗效。体会到在辨证