结合Q学习和模糊逻辑的单路口交通信号自学习控制方法

来源 :计算机应用研究 | 被引量 : 42次 | 上传用户:tt77uu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对城市交通系统的动态性和不确定性,提出了基于强化学习的信号交叉口智能控制系统结构,对单交叉口动态实时控制进行了研究。将BP神经网络与Q学习算法相结合实现了路口的在线学习。同时,针对交通信号控制的多目标评价特征,采用基于模糊逻辑的Q学习奖惩信号设计方法,实施对交通信号的优化控制。最后,在三种交通场景下,应用Paramics微观交通仿真软件对典型十字路口进行仿真实验。结果表明,该方法对不同交通场景下的突变仍可保持较高的控制效率,控制效果明显优于定时控制。
其他文献
针对传真图像,为了提高版面分割与分类准确率,提高处理速度,以连通区域为处理元素,通过合理设定阈值,将水平和垂直相邻连通区域进行合并,快速准确地分割图像。并且将版面分割过程与分类过程相结合,根据连通区域的大小建立矩阵,提取能够表征区域信息的八维特征,然后使用BP神经网络将版面区域分为文字区域和非文字区域两类。实验中得到版面分割准确率为89.2%,版面分类准确率为94.22%。实验结果证明,该算法能够
针对当前智能除草控制系统的非线性、时滞性及喷施精度过低等问题,设计了一种基于超代遗传算法(HG-GA)优化的模糊PID控制方案。在该方案中,针对智能除草装置的特点,设计了对应的模糊PID控制器,并对控制器的各因子进行遗传优化,从而提高系统的控制效果,同时加快了优化速度。实验结果表明这是一种有效的控制策略,尤其是在处理非线性及外部干扰方面有更好的鲁棒性。
提出了一种能应用在中高压系统的新型混合型有源电力滤波器,并提出一种新的直接功率控制算法。首先给出了新型混合型有源电力滤波器的拓扑结构,并通过其电气模型得到系统的传递函数,利用传递函数分析了该滤波系统的滤波原理及谐波抑制能力。利用Routh判据对该滤波系统的稳定性进行分析,验证该系统能稳定运行。同时研究了一种新的直接功率控制算法,通过仿真实验,验证了该滤波系统和控制算法的有效性。
针对服务计算环境下用户对其所使用服务的评分,依据其服务关注点的不同而不同,即使是同一个服务,不同用户的评价标准也不一样,推荐者的选取不仅与其所处环境上下文有关,还与推荐者对服务的关注点有关。为了使用户推荐更加可靠、有效,提出基于服务关注点相似度的推荐算法。该算法解决了用户盲目搜索推荐者的问题,使用聚类算法生成用户聚类簇,根据用户间的相似度在聚类簇内进行推荐者的搜索,既提高了推荐的可靠性,又提高了搜
为了提高高校资源的利用率,利用当前各高校信息化工作的成果,提出了一个基于SOA的Web服务组合的校际间资源共享协作服务的方案。该方案立足各高校已建成业务系统,对原有功能进行Web服务封装,利用Web服务复用,通过工作流引擎驱动业务流程的模式,满足校际间逻辑业务的新需求。该协作服务模型有别于高校内部应用整合的系统集成方案,是一种松耦合的业务功能组合模式,高校内原有业务系统的升级改造不会影响校际间的逻
针对辩论的产生是基于辩论的谈判中agent决策机制的核心问题,提出了一个基于冲突解决和辩论分类的辩论产生机制,该机制包括谈判agent的多目标优化模型、谈判过程控制的状态机协议以及基于冲突解决的辩论生成策略等。最后通过一对一商务谈判原型系统验证了所提模型、协议和策略的有效性。
主要针对计算机经济信息系统由构件和连接件形成的可靠性模型及其应用进行了研究。根据现代贝叶斯网络方法具有推理精确、直观易理解和较强可操作性的特点,经过对经济信息系统的实例分析可以得到系统可靠性计算概率值与系统诊断的分析结果。说明该模型可方便地用于经济信息系统的可靠性计算和系统可靠性诊断,并可以在第三方构件和异构环境中进行可靠性分析。
针对目前基于语义Web服务网络制造资源发现机制的缺点,提出了制造资源UDDI(universal description,discovery and integration,统一描述、发现和集成)和WSIL(Web service inspection language,Web服务检查语言)相结合的联合式发现机制。在UDDI中进行基本工艺特征匹配,相对应的特征值匹配在本地WSIL中进行,并构建网络
针对炼钢连铸动态调度问题,建立了问题的优化模型,设计了约束满足求解算法并分析了算法复杂度,开发了炼钢连铸动态调度的人机交互系统。当生产过程中的扰动事件发生时,系统能够通过人机交互并结合优化模型和多项式时间复杂度的算法获得可行且与原调度尽量一致的新调度方案,以确保动态调度前后整个生产过程的连续性和稳定性。