基于团树传播的强化学习交通信号协调控制的研究

来源 :微型电脑应用 | 被引量 : 0次 | 上传用户:ltqhan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前城市交通信号控制效率低下,致使车辆在道路交叉口等待时间较长,停车次数较多等问题,提出了一种新型的基于团树传播算法的强化学习控制方法来协调控制网络级交通。分别重点介绍强化学习算法与以联合树算法为代表的团树传播算法如何与交通控制相结合以及联合树算法是如何实现联合动作推理的。选取24个交叉口组成的路网为研究对象,在交通仿真软件VISSIM中进行仿真,软件可读取当前环境的状态,选取车辆的平均延误和平均停车次数作为性能指标,同时,分别与相邻路口简单协调的强化学习控制算法、无学习的LQF算法控制效果进行比较。
其他文献
目的:为制定中国青年女性血红蛋白正常参考值的统一标准提供科学依据。方法:收集了中国208个单位用氰化高铁血红蛋白(HiCN)法测定的20475例青年女性血红蛋白正常参考值,运用
目的了解厅局级干部人群健康状况,为疾病预防控制提供信息。方法整群抽样,体格检查,腹部B型超声波、胸部X光检查,血生化检查,酶法测乙肝血清标志物,χ2-检验,u-检验。结果男
番茄筋腐病也称条腐病或带腐病,是番茄生长过程中普遍发生的生理病害之一。发病轻时仅部分果实品质降低,但发病重的地块,病果率可达70%,甚至绝收,严重影响番茄的生产。低温寡
[目的]探讨运用临床护理路径在重型颅脑损伤院前、院内急救阶段的效果。[方法]采用非同期对照研究,将某院急诊科2009年1月~9月120出诊接回的重型颅脑损伤病人41例为对照组,按
采用问卷测量法,对河南347名高中生进行调查,研究高中生负面评价恐惧、自我效能感与考试焦虑的关系.结果发现:不同年级的高中生考试焦虑水平有显著差异;考试焦虑与负面评价总分,以
目前飞行器高频力学环境预示主要采用有限元-统计能量混合方法,但由于缺乏模态密度、内损耗因子、耦合损耗因子等统计能量分析参数,导致声振响应预示结果不够准确,给结构和载
目的为确保医院医疗安全,防止医院感染发生,必须建立一套完整的清洗、消毒与灭菌。方法通过冲洗、洗涤、漂洗、终末漂洗、干燥、检查对内镜进行彻底清洗、消毒与灭菌。结果运
针对液压比例伺服系统中比例阀存在着严重的死区特性,提出了一种补偿方法,用于克服死区对系统控制性能的影响。该方法是将常规PID与补偿方法相结合,通过在常规PID输出的基础上叠
目的:评估冠脉造影与冠状动脉计算机断层扫描血管成像技术(CTA)检查对高龄患者对比剂急性肾损伤(CIAKI)的发生风险的影响。同时评估水化对CIAKI的预防效果以及不同造影剂对CI
<正>项目地址:贵州省六盘水市项目面积:90公顷项目委托:六盘水市政府设计:土人设计Turenscape,北京大学建筑与景观设计学院首席设计师:俞孔坚设计团队:栾博、黄刚、闫斌、单