基于CMAC强化学习的交叉口信号控制

来源 :计算机工程 | 被引量 : 0次 | 上传用户:hamjh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用神经网络值函数逼近的强化学习方法处理交叉口的信号控制。根据交通流及交叉口信号特征,建立强化学习的状态空间、动作空间和回报空间,以最小化车辆在交叉口的延误为控制目标,对信号进行优化控制。引入小脑模型关节控制器神经网络对强化学习(RL)的Q值进行逼近。在变化的交通条件下,使用典型交叉口对提出的RL模型进行验证,同传统的定时控制和全感应控制进行对比分析。仿真结果表明,RL控制器具有较强的学习能力,可以适应交通流的动态变化,稳定性好、自适应性强,对于环境变化具有较强的适应能力。
其他文献
在现代企业制度中,股权激励作为一种有效的长期激励机制,受到越来越多的关注。然而,在我国上市公司的实践中,实施股权激励的公司,实施效果不尽相同,其中包含很多公司中途取消股权激
我国沪深300股指期货于2010年4月16日正式推出,其交易时间同股票现货市场存在显著差异,即股指期货市场早于股票现货市场15分钟开盘,迟于股票现货市场15分钟收盘。本文基于股票现
目的研究探讨人性化护理在内科护理中的临床实践效果。方法研究时间为2015年8月-2018年8月,随机将此阶段至医院接受治疗的48例心内科患者视为观察组,将同期接受治疗的48例心
地表蒸散是维持地球表面水量平衡和热量平衡的重要环节,SEBAL模型作为一种快速且有效的反演地表蒸散的遥感物理模型方法,在地表蒸散研究中得到广泛应用。地表反照率作为影响
随着信息技术的发展,网络技术逐渐成为人们工作、生活中的重要部分,在给人们提供方便的同时,也带来诸多隐患。本文首先分析了大数据环境面临的安全威胁,然后探讨了网络安全的
现有的日志文件保护技术大多集中于保护日志文件不被外来攻击者攻击,而无法抵御恶意的合法用户的攻击。为此,在分析日志技术安全需求的基础上,提出一种在不可信环境下的客户
心力衰竭是妊高症的严重并发症,也是妊高症孕产妇死亡的主要原因之一。我院于2000年4月收治了1例重度妊高症并发急性左心衰竭的患者,经抢救治愈出院,现将护理体会报告如下:
可溶盐对多孔文物的危害较大,可使文物产生粉化、脱落、剥落等多种较为严重的病害。及时清除文物本体内的可溶盐,可以很好地保护珍贵的历史文化遗产。对砖石文物进行脱盐,可
全髋置换术适用于65岁以上的老龄患者,但超过百岁的受术者却很少。我科2002年11月收治1例103岁的患者,据文献检索,该患者为国内年龄最大的1例患者。高龄患者除了具有一般老人的