基于深度强化学习的交通信号控制方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hzwn001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通信号的智能控制是智能交通研究中的热点问题。为更加及时有效地自适应协调交通,文中提出了一种基于分布式深度强化学习的交通信号控制模型,采用深度神经网络框架,利用目标网络、双Q网络、价值分布提升模型表现。将交叉路口的高维实时交通信息离散化建模并与相应车道上的等待时间、队列长度、延迟时间、相位信息等整合作为状态输入,在对相位序列及动作、奖励做出恰当定义的基础上,在线学习交通信号的控制策略,实现交通信号Agent的自适应控制。为验证所提算法,在SUMO(Simulation of Urban Mobility)
其他文献
近年来,深度学习取得了重大突破,融合深度学习技术的神经机器翻译逐渐取代统计机器翻译,成为学术界主流的机器翻译方法。然而,传统的神经机器翻译将源端句子看作一个词序列,
“合肥,坐拥巢湖,因水建城,因水得名,也必将因水而兴。”经过几年的巢湖综合治理,合肥“因水而兴”的愿景正逐步变为现实。  2015年10月,亚洲开发银行在总部马尼拉发布新书说,得益于创新的改革措施,亚行在中国的一项治理大型湖泊项目进展顺利,其经验可供中国乃至国际社会所借鉴。  该书所提的大型湖泊项目即是巢湖,这本书除了介绍巢湖治理的具体举措,还重点提及巢湖治理给合肥带来诸多湖泊治理之外的红利。  
技术本身或许没有优劣,而由此技术形成的网络规模,以及相应的网络效应带来的价值,才是决定其生存时间的关键因素。    不知道大家有没有发现这样一个现象:在我们的生活中,一些看起来很落后的技术或者事物,并未被新技术新事物淘汰,反而继续存在下去;而一些看起来很先进的技术,由于某种原因,却胎死腹中。这是不是很奇怪?  举几个有趣的例子。  传真机  一样的道理,传真机也是个技术落后的东西,明明可以邮件却要
武汉等城市也在快马加鞭求创新。放眼长三角、远望珠三角,上海、合肥获批综合性国家科学中心,深圳已成为全球科创中心,杭州全力冲刺数字经济第一城。南京作为长三角副中心城市、南京都市圈中心城市和江苏省会城市,该怎么办?  答案唯有创新。南京要发展,必须抓创新;南京抓创新,必须争一流。  国内对标深圳、  国际对标波士顿  “资源优势不等于创新优势,政府作为不等于创新有为,自主创新不等于封闭创新,人才流入不
走进蒙城,一股谋发展的劲头和改革创新的热情扑面而来。2013年,蒙城以敢为人先的锐气,率先推行“一块田”改革。虽然“一块田”变动的只是一条小田埂,撬动的却是农业现代化的
中共中央政治局常委、国务院总理、国务院振兴东北地区等老工业基地领导小组组长温家宝。日前主持召开国务院振兴东北地区等老工业基地领导小组第一次全体会议,并做了重要讲话
近日,卫生部以卫政法发(2005)187号文,下发了《认真贯彻实施〈疫苗流通和预防接种管理条例〉的通知》(以下简称《通知》)。
传统行业相继进入新的零售时代,家具行业也迎来了全新的竞争。而如何运用全渠道零售模式为家具行业服务,打通线上线下平台,传达企业品牌信息,升级购物体验,都是需要解决的问
目前,我国华南地区、华东地区、华北地区、东北地区、西部地区及中部地区已初步形成家具生产区域,但是现有产业集群如何利用地域优势总结归纳出地域设计创新方法是目前面临的
编者按:  此为武克钢先生慷慨谏言。  作为伴随着改革开放成长起来的企业家,武克钢时有肺腑之言。两年前,他呼吁中国需要构建工商文明,引起强烈反响。今天,在中小企业倒闭潮汹涌而回应者寥寥之时,他站出来呐喊,对于支撑了30年中国经济神话的中小企业,决不能让它们生如草芥,死如尘埃。它们的消亡是整个国家、社会的痛。  “中小企业是低端的、消耗资源的,理应被淘汰的。”可是有谁去细数过50.2%的税收、75%