平均排队长度差最小的单交叉口在线Q学习模型

来源 :湖南理工学院学报(自然科学版) | 被引量 : 0次 | 上传用户:seanray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
建立了以平均排队长度差最小为优化目标的在线Q学习模型.针对控制性能指标相对于临近的配时方案不敏感的特点,提出了以平均排队长度差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.集成ExcelVBA、Vissim、Matlab建立了在线仿真平台,作为计算环境对模型进行了计算.利用GPS数据对Vissim软件中车辆加减速度曲线进行了标定.计算结果表明以平均排队长度差作为优化目标能够优化整个交叉口的时空资源,本文建立的在线Q学习模型具有较快的收敛速度和鲁棒性,通过学习能够
其他文献
采用极化曲线,塔菲尔图(Tafel Plot),交流阻抗(EIS)及浸泡腐蚀技术,研究了激光熔化沉积γ/Mo2Ni3Si合金在不同酸,碱,盐介质中的腐蚀行为。结果表明,该合金在1mol/L NaOH溶液中,由于形成了
贫困生资助是充满爱心与正义的善事,又是严肃而又复杂的工作,更是政府重视、社会关注的责任工程。事实表明,资助工作只有遵循自愿、务实、尊重、公平、规范的基本原则,才能把惠及
从航天育种,卫星遥感土地资源调查,农作物卫星监测和估产三个方面阐述了航天技术对农业现代化的促进作用,并以确凿的数据证明,航天育种技术已经产生了惊人的增交效果,并将产生巨大
文章以求职场域、惯习为理论脉络深入分析了长春市近郊农民工在都市求职场域与近郊乡村之间的生存状态。笔者认为近郊农民工进城是一种在惯习制约下的选择,不仅有价值理性的
物理教学中知识的概括、方法的总结、题型的归类往往特别重要,而教学过程中应用一些特殊的结论,往往可以给解决某些问题带来极大的方便.但是这样的结论往往因为没有注重追本
<正>1925年五卅惨案发生后,王若飞以中共中央特派员身份来河南领导工作。接着,萧人鹄、范易、余立亚、马玉夫、张霁帆、张景曾、高风、陈九鼎(后叛党)、戴培元、唐士奎、刘昌
采用粉体化学镀技术,以AgNO3取代常见的贵金属盐PdCl2作为活化剂、H2PO2取代Sn^2+作为还原剂,经一步前处理过程,在空心微珠表面沉积NiCoP台金。利用扫描电镜、能谱分析仪以及X射
针对大断面高速铁路隧道施工过程中出现的复杂施工力学问题,以花甲山高速铁路隧道为依托工程,采用三维数值软件对花甲山隧道的施工动态过程进行数值模拟,得到了隧道围岩的应力、
1总体评价2020年全国高考理综卷Ⅲ物理试题加强教考衔接,充分发挥高考上连高等教育、下接基础教育,承担人才选拔和培养重要使命的"指挥棒"的积极导向作用,全面贯彻德智体美劳
【摘要】文章分析了现在比较成熟的风险投资退出方式和影响风险投资退出方式的多种因素,并根据我国的实际情况提出了我国应该如何健全风险投资的退出方式,对我国的风险投资的发展提供一定的参考。  【关键词】风险投资;退出方式;健全  【中图分类号】 F830 【文献标识码】A  【文章编号】1671-5969(2007)11-0013-02    风险投资(Venture Capital,也被称作创业投资)