基于多智能体的城市路网交通信号控制研究

来源 :东南大学 | 被引量 : 1次 | 上传用户:zhangdong1231
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通信号控制是缓解交通拥堵、提高出行效率和减少安全事故的重要手段。固定配时方法是交通信号控制系统常用的控制算法,其缺点在于难以根据实时的交通流实现红绿灯信号的自由切换,增加不必要的等待时间。因此寻求更加高效、智能的交通信号控制方法愈加受到研究者的关注。由于交通控制系统是一个复杂的不确定系统,并具有非线性结构,传统的自适应方法虽然颇有成效,但还是难以适应多变的交通流,对交通模型依赖严重。而强化学习方法不需要建立交通模型,而是通过路口控制器与交通环境的不断交互与学习,实现控制方案的改善。本文将交通信号控制系统当成由单个交叉口信号控制器Agent组成的多智能体系统,并引入强化学习方法实现城市路网交通信号控制。对路网的最小控制单元,即单交叉路口的研究是实现区域交通控制的基础。当前科技的迅速发展使得交通数据的收集更加便捷,为了充分使用收集的交通数据,引入深度强化学习算法实现交叉口的实时控制,并提出了一种新的状态空间设计方法。解决了传统强化学习方法难以应用到状态空间较大或连续系统中的弊病。并使用深度强化学习算法在微观交通仿真软件SUMO中对单个路口进行仿真,实验结果验证了该方法的有效性。在单交叉口信号控制的研究基础上,对多交叉口信号控制系统的结构展开研究,并探索了基于协作图的Max-plus算法在区域交通协调控制中的应用。进一步在深度强化学习算法的基础上,引入博弈论相关知识,建立了基于n人非零和合作博弈的多智能体交互模型,并建立相应的博弈表求解当前环境下的Nash均衡,在此基础上提出Nash Q学习算法,实现了区域交通信号控制,并使用该方法对区域交通系统进行仿真,实验结果验证了所提方法的有效性。
其他文献
“唐宋诗之争”是中国古典诗歌史上的公案,一般认为始于南宋张戒的《岁寒堂诗话》。“唐宋诗之争”反映的是诗歌宗尚问题,但是与南宋并行的金王朝的诗歌宗尚问题,却少有研究。关于金诗宗尚问题,大多数是附带在金诗风格或者金代诗学研究之下,没有专门的研究,更没有金诗宗尚对后来“唐宋诗之争”影响的研究。本文按照时间顺序,选取代表人物,专门就金诗的宗尚问题进行了梳理,探讨金诗自身的形成以及其在“唐宋诗之争”问题中的
春暖花开,潜江“宠儿”小龙虾也悄悄出洞,闪亮登场。2015年3月18日,在潜江吃油焖虾最有名的龙虾一条街看到,不少餐饮店已陆续打出招牌,将这舌尖上的“宠儿”推上餐桌。
冀北康保地区纵跨两个大地构造单元。研究区南部为“华北克拉通北缘”,研究区北部边缘为“中亚造山带南缘”。研究区属坝上深覆盖地区,且水系相对不发育,故近年来该区找矿勘
兽药企业从上个世纪90年代初期开始发展,共有几次大的发展机会,很多从业人员抓住并完成了创业阶段的原始积累,但在兽药行业快速成长的初期,出现了大量的无序竞争。那么,我们的盈利
桉树资源丰富,广西每年桉树皮的数量为416万立方米,一直以来未得到有效利用,大部分作为燃料。桉树皮化学组成丰富,含有大量的多酚类物质,可部分替代苯酚制备酚醛树脂。正因为如此,桉树皮这种生物质资源,受到科研工作者的关注。本论文以桉树皮资源作为研究对象,对桉树皮提取物、桉树皮粉和桉树皮灰的化学组成进行分析;以桉树皮提取物、球磨桉树皮粉和偶联处理桉树皮灰为原料,制备改性酚醛树脂胶粘剂,并对胶粘剂的性能进
奶牛真胃变位在兽医临床上可以分为左方变位和右方变位。左方变位是真胃通过瘤胃底部从腹腔右侧移至左侧,置于瘤胃和左侧腹壁之间;右方变位是指真胃在右侧腹腔发生不同程度的扭
城市管理是一个人人关注的永恒主题,笔者根据自己身边所见所闻,从理论角度分析了公众城管是现代化城市发展的必然趋势,因为它符合辩证唯物主义的观点,体现以人为本的原则,能
本文分析了中兽药的开发思路,并介绍了中兽药标准的制定情况。《司牧安骥集》记载:“昔神农皇帝,创置药草八百余种,流传人间,救疗马病”。这虽然是一种传说,但也反映出我国古
从平流层和对流层的大气化学过程入手,分析了研究各个反应所采用的测量手段;从当前大气化学的发展要求提出了理论研究和模式建立中对仪器测量手段的要求。并且从测量平台这一角度分析了目前在大气化学领域使用的主要测量仪器和手段。
利用沙门氏菌分解底物形万物地征性荧光的特性,建立了水质沙门氏菌群的”酶-底物“快速检测方法。检测试剂由上医大实验室自行合成,经红外,质谱,核磁共振分析,证明其结构与国报道一