基于MFD-DDPG的道路交通区域边界控制方法

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:duokuo1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着城市规模的持续扩大,以及机动车保有量的不断增加,交通拥堵已经成为影响城市治理和经济发展的主要问题。区域交通拥堵频发已经成为制约城市经济发展及社会活动的主要因素之一,同时对区域交通管理水平提出了更高的要求。针对交通区域拥堵特点探究区域交通优化控制方法已经成为交通管理与控制领域研究的重点与难点问题之一。边界控制方法的研究是区域交通控制优化研究的核心内容之一。随着AI技术的发展,越来越多的AI方法,如强化学习、深度学习,被应用于城市道路交通边界控制方法研究中,并取得了很好的效果。不同于传统的边界控制模型通常需要精确的交通信息支持,本文在基于宏观基本图(MFD)的基础上,针对不需要交通确定信息支持下的边界控制问题,引入强化学习中的Q学习算法和深度强化学习中的DDPG算法,提出了MFD-QL边界控制模型和MFD-DDPG边界控制模型,并且对两个算法分别进行了基于数值和基于仿真的实验验证,主要工作如下。1.面向区域边界控制的MFD-QL模型将MFD与Q学习算法相结合,采用从MFD中的最佳密度作为Q学习算法判定奖励值的依据,构建了MFD-QL模型,该模型能够依据MFD进行自主学习并获得最佳的控制策略。2.面向区域边界控制的MFD-DDPG模型由于“状态-动作”空间增大导致了计算难度增加,算法效率受到极大影响,为了解决这一问题,在MFD-QL基础上引入深度神经网络,构建了MFD-DDPG模型,该模型能够满足区域多路口边界控制优化计算要求,为算法在实际工程中的应用提供了技术支持。3.基于数值分析与仿真的实验验证针对MFD-QL和MFD-DDPG算法,分别进行了数值实验分析和仿真实验分析,实验结果证明算法能够快速收敛到稳定态,在区域边界控制优化中取得了较好的控制效果。本文的研究立足解决交通区域边界控制优化问题,完成的工作对交通区域边界控制研究以及AI技术在该领域的应用推广提供了理论与方法的支持。
其他文献
目标跟踪在物流仓储、机器人自动化以及无人驾驶等诸多领域有着广泛的应用前景,而多目标跟踪是其中最具挑战性的研究方向之一。目前主流的多目标跟踪算法主要有两种研究思路,分别是将目标检测与数据关联相结合的TBD(tracking by detection)方法以及将单目标跟踪方法扩展到多目标场景的SOT(single object tracking)扩展方法。后者依托发展较为成熟的单目标跟踪技术,在跟踪鲁
学位
随着教育信息化的发展,学生的各种学习行为产生了大量的数据。为使数据发挥出应有的作用,运用机器学习算法探索和利用教育数据蕴藏的价值成为研究学者的研究重点。海量数据的出现为教育管理者提供大量潜在的价值,有助于提高管理者的管理效率,教育管理者可以根据学生的数据信息统筹规划,从教学方式管理、教学模式管理入手,提高管理水平,为学业有风险者提供预警。根据毕业生去向的具体情况,考研、就业、创业等不同的毕业去向对
学位
随着电动汽车产业的快速发展,电动汽车在使用过程中所暴露的问题越来越多,动力电池系统作为其核心部件,其健康程度密切影响着电动汽车的安全性能,持续的亚健康状态如果不能被及时发现和处理,可能会引发电池故障的产生,给驾驶员和乘客带来财产损失,甚至危及生命。本文基于监控的电动汽车运行数据,结合数据驱动方法,对动力电池系统典型亚健康状态进行辨识,本文具体研究工作包括:(1)对监控的电动汽车运行数据进行处理,首
学位
高职院校抖音短视频平台建设在助力校园文化建设方面具有独特优势,但目前在建设力度、特色彰显、外塑形象、互动管理等方面还存在不足。要通过提炼展示高职院校特色,分析回应高职学生需求,统筹密切线上线下联动,指导规范平台运营管理等方式,充分发挥抖音短视频在助力高职校园文化建设中的作用。
期刊
近年来随着交通安全领域研究的逐渐深入,交通事故数据及事故原因分析已成为重点分析对象,通过统计方法或交通冲突理论方法的交通安全研究体系较为完善。而相比较于事故数据,行驶轨迹数据体量大、实时性强,能弥补交通事故数据的延后评价问题。从轨迹数据可以识别出车辆异常驾驶行为,此类行为可能导致交通安全隐患。研究异常驾驶点位在路网中的分布情况,能对交通安全问题进行评估,尤其是针对安全性较差的交叉口位置,寻找引发交
学位
差异化定价策略通过票价调节引导客流转移,是解决城市轨道交通高峰客流拥挤的一项有效策略。本文基于AFC(Automatic Fare Collection System)数据分析,从乘客出发时间选择行为着手,构建城市轨道交通早高峰分时定价模型,为轨道交通差异化定价策略提供理论支持,具体研究内容如下:(1)乘客出行时间特征分析及弹性乘客识别:以AFC数据记录的乘客出行特征为基础,定义乘客“出行波动系数
学位
近年来,网联交通发展迅速,道路机动车交通流逐渐演化为网联车辆与非网联车辆构成的新型混合交通流。由于网联车辆所具备的信息交互特征等与非网联车辆不同,这对传统的交通流模型产生了影响,原有的面向非网联车辆的换道模型,已不适应新型交通流环境。因此,有必要对新型交通流环境下的换道模型展开进一步的研究,以支撑交通管理与控制方案的形成,进而缓解道路交通拥堵。论文对网联环境下车辆换道行为模型进行研究分析,构建了基
学位
步入21世纪以来,人民生活水平不断提高,人们对生活的追求已经不再局限于物质方面,而是逐渐拓展到了精神层面。于是,越来越多的人选择利用闲暇时间旅游,这在很大程度上促进了旅游经济的发展,同时也带动了相关地区经济发展水平的提高。本文立足于当前阶段地区旅游经济发展的实际情况,探讨地区旅游经济在发展过程中面临的问题,并在此基础之上寻求相应的应对策略,希望能够为更好地促进地区综合发展水平的进步以及旅游业的创新
期刊
随着非线性偏微分方程在数学、物理、生物工程、非线性光学等领域的应用越来越广泛,对其精确解的研究也成为了一项重要的工作。与线性方程一样,非线性偏微分方程也有方程组、分数阶等不同形式,本文选取了两种不同形式的非线性偏微分方程,分别对其精确解进行了研究。它们是非线性Konno-Oono耦合方程和时空分数阶Phi-4方程。非线性Konno-Oono耦合方程是一个非线性偏微分方程组,针对此方程,本文应用Ri
学位
随着网络技术的普及,每个人既是信息的发布者和传播者又是信息的受众,金融领域与网络论坛深度融合拓宽了投资者沟通和交流的平台,这些金融论坛不仅改变了信息的传播方式,也加剧了金融市场的“羊群效应”等非理性投资行为。近年来深度学习等算法越来越多的运用于金融市场,对网络论坛的投资者情绪以及金融数据的相关研究也越来越丰富,股指期货市场作为金融市场的重要组成部分也吸引着金融研究者们对其进行预测研究。本文以深度学
学位