单交叉口多相位在线Q学习交通控制模型

来源 :交通科学与工程 | 被引量 : 0次 | 上传用户:passiionlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了优化交叉口信号配时,通过集成Excel VBA-Vissim-Matlab的仿真平台,建立了以总关键排队长度之差最小为优化目标的单交叉口在线Q学习模型,包括定周期和不定周期两种模式的Q学习配时模型.针对控制性能指标相对于邻近的配时方案不敏感的特点,提出了以平均总关键排队长度之差作为基本单位重新构造奖励函数,目的是拉大各行为对应的Q值差距,提高模型的收敛速度和鲁棒性.通过算例,将定周期Q学习配时方案、不定周期Q学习配时方案与Transyt配时方案进行对比.研究结果表明:以总关键排队长度之差作为优化目标能
其他文献
研究了如下非线性微分方程x^1=A(f)x+f(t,x),利用指数型二分性理论和李雅普诺夫第二方法,得到了上述扰动系统在一定的条件下能和其线性系统保持同步的稳定性,推广了现有的相关理论。
生产实习对于提高大学生总体素质来说相当重要,但目前高等院校生产实习的教学改革还存在着一些不尽如人意的情况和问题,本文通过调查了解相关情况及问题并对此提出一些看法。
1 合理密植确保通风透光良好.西瓜密度667m2早熟品种800~1 000株,中晚熟品种500~800株,嫁接苗200~500株,无籽西瓜约500株.间作套种要加大行距,保护地栽培不能过密,以不互相遮光,
利用Hilbert空间中正交投影的有关理论,给出并证明了最佳线性预测在内积定义下的一个定理,以此作为适时递归预测的基础。讨论了新息递归算法的理论和方法,将新息算法运用于多维M
环境与市政工程实验中心前身为苏州城建环保学院环保系实验室,始建于1984年。为了适应专业调整和管理需要,经过不断的整合建设,逐步形成了以环境污染控制、流动与传质及城市给水
基于Hamilton能量变分原理和薄板的基本假设,考虑地基阻尼的影响,建立了双参数粘弹性地基上考虑耦合效应的四边自由矩形薄板的非线性自由振动方程以及板域外的控制方程.应用
对斜拉索在轴向基础激励条件下的振动进行了理论分析,并建立了拉索面内运动模型。基于哈密顿变分原理,求得了拉索的非线性运动方程。利用Galerkin法,将方程解耦。并运用多尺
目的从分子病因学的角度探索血小板糖蛋白(Glycoprotein,GpⅡb)的基因多态性是否与脑梗死的发生相关,为缺血性卒中的预防及进一步治疗提供理论基础.方法选取病例组122例,对照
阐述了社区图书馆是现阶段大中城市社区文化建设的重点,对如何做好图书馆的社区服务工作进行了论述。
本文以台湾真理大学旅游学院为例,采用问卷方法,研究学生从事旅游实习的期望与成效。研究表明:(1)学生在选择实习单位时自主性高,不易受外界环境影响因素左右;(2)学生对从实习获得实际操作技术经验及专业知识有高度期望;(3)实习的最大收获为实质的知识与专业技能的获得;性别、实习的找寻方式、业者提供的实习方式(例如工作轮调,沟通管道和职前培训)和企业的规模均对学生实习期望和成效有一定显著影响;学生实习期望越高时,所获得的实习成效将相对提高。