基于深度强化学习的交通配时优化技术研究

来源 :沈阳理工大学 | 被引量 : 0次 | 上传用户:jamyi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因为我国经济的高速发展、人民收入水平随之的不断提高、全球城市化进程的不断加速,导致城市路网中车辆数量在一个较大的基数上持续增加。除此之外,在高品质生活下的日常活动中,很多方面也增加了城市路网中的车辆数量。城市路网中车辆数量的增加导致交通拥堵、交通疏通不及时、路口交通事故等现象逐渐严重化和普遍化,这些现象已经开始由大中型城市向中小型城市蔓延,同时也成为困扰世界各城市的主要社会问题,制约着经济和社会的发展,日益引起各国政府的高度重视。解决城市交通问题,首先解决交通拥堵问题,而交通信号配时是解决交通拥堵问题的重要手段。鉴于交通信号配时在城市交通系统中的关键作用,发展更加有效的城市交通信号配时策略才是解决城市交通拥堵问题的根本出路。在交通配时技术上,基于传统Q-Learning的交通信号配时策略是解决交通配时问题的重要手段,但它存在繁琐的Q值表建立和搜索、目标Q值容易被高估、无法长期记忆经验等问题,导致疏通环境交通拥堵的效果有限。然而,深度强化学习本身具有的深度网络以及引入的经验池、贪婪策略、DOUBLE DQN等方法技术,可以很好的解决传统Q-Learning在交通信号配时上存在的上诉问题。为此,我们在基于传统Q-Learning的交通信号配时策略上,提出采用深度强化学习(DQN)策略来优化交叉口信号配时技术。以减少交通系统中滞留于路网中的车辆数量和所有通过交叉口的车辆的所用的平均行驶时间。实验结果表明,基于深度强化学习(DQN)的交通信号配时策略对于疏通交叉路口车辆方面优于传统Q-Learning策略,可以更好的疏通环境交通拥堵,提高交通系统的通行效率。
其他文献
尖晶石型镁铁氧体由于其具有较好频率特性和良好的光谱选择吸收性能使其成为重要的吸波材料。其磁各向异性比其它带有磁矩的金属阳离子尖晶石型铁酸盐类要低,被广泛用做防止
以β-sialon粉、活性氧化铝微粉和氧化硅微粉为原料,研究了在焦碳保护下,β-sialon/Al2O3/SiO2体系材料经1 500,1 600,1 650℃烧成时,该体系材料的烧结性能和物相变化,同时借
用氧化物混合方法制备了主晶相为(Zr0.7Sn0.3)TiO4的高频陶瓷材料.添加Sb2O5,ZnO和玻璃有效降低了陶瓷的烧成温度和介质损耗.添加0.5%Sb2O5(摩尔分数),1.5%ZnO(质量分数)和3.
描述了旋喷结合分解炉内气体流动的基本运动方程, 提出了用重整化群(renormalization group)k-ε方法处理旋喷结合分解炉数值模拟的方法, 并针对工程应用中的分解炉进行了模
目的:探讨炎症反应参数:Glasgow预后分数(GPS)、改良Glasgow预后分数(mGPS)、C-反应蛋白/白蛋白比(CAR)、中性粒细胞/淋巴细胞比(NLR)、血小板/淋巴细胞比(PLR)、预后指数(PI)、预后营养指数(PNI)、全身免疫炎症指数(SII)是否影响肺癌患者的生存时间。方法:收集2016年1月至2018年9月之间的296例肺癌患者的临床随访资料,运用COX 比例风险回归模型进
我国旅游发展迅速,人们对导游人员的需求随之增加。然而,导游处于一种尴尬的状况:一方面好的旅程需要导游优秀的服务与游客的参与;另一方面导游和游客之间矛盾不断,严重影响
Sound, as the English satirist Samuel Butler would say, is but wind. Waves moving through the air vibrate our eardrum and get interpreted by the brain as sweet
期刊
碳/碳复合材料作为骨植入材料具有良好的生物力学相容性, 但没有生物活性.以玻璃片为基板进行预试, 发现溶胶-凝胶法制备的锐钛矿型二氧化钛薄膜可在快速钙化溶液中诱导沉积
我公司前段时间对抛釉砖生产线进行提产,将烧成周期由35分钟提到30分钟后,我们将调整前后,同花色的产品进行对比,发现该产品的颜色和图案都有较大的区别。窑炉提速后的产品颜色没