基于强化学习的交叉口交通低排放信号控制研究

来源 :电子技术 | 被引量 : 0次 | 上传用户：auh123123

【摘要】

：

交叉口车辆排放较为复杂,尤其是在考虑初始排队长度的情况下,更是难以建立明确的数学模型。Q学习是一种无模型的强化学习算法,通过与环境的试错交互学习最优控制策略。本文提

【作者】

：

李昕

【机构】

：

中国科学技术大学信息科学技术学院,

【出处】

：

电子技术

【发表日期】

：

2014年08期

【关键词】

：

Q学习模糊推理交通信号控制排队长度尾气排放 Q-learning Fuzzy inference traffic signal control queu

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

交叉口车辆排放较为复杂,尤其是在考虑初始排队长度的情况下,更是难以建立明确的数学模型。Q学习是一种无模型的强化学习算法,通过与环境的试错交互学习最优控制策略。本文提出了一种基于Q学习的交通排放信号控制方案。利用仿真平台USTCMTS2.0,通过不断地试错学习找到在不同相位排队长度下最优配时。在Q学习中添加了模糊初始化Q函数的方法以改进Q学习的收敛速度,加速了学习过程。仿真实验结果表明:强化学习算法取得较好的效果。相比较Hideki的方法,在车流量较高时,车辆平均排放量减少了13.9%,并且对Q函数值的模糊初始化大大加速了Q函数收敛的过程。 Vehicle emissions at the intersections are more complicated, especially when considering the initial queue length, it is even more difficult to establish a clear mathematical model. Q learning is a modelless reinforcement learning algorithm that learns the optimal control strategy by interacting with the environment in trial and error. This paper presents a Q-based traffic emission control scheme. Using the simulation platform USTCMTS2.0, through continuous trial and error learning to find the optimal timing in different phase queuing length. In the Q learning, fuzzy initialization Q function is added to improve the Q learning convergence speed and speed up the learning process. The simulation results show that the reinforcement learning algorithm achieves good results. Compared with Hideki’s method, average vehicle emissions are reduced by 13.9% at higher vehicle traffic levels, and the fuzzy initialization of Q-function values greatly accelerates the Q-function convergence.

其他文献

GSS-II复位内固定治疗胸腰椎骨折的临床疗效研究

目的分析GSS-II复位内固定治疗胸腰椎骨折的临床疗效及安全性.方法对54例中重度胸腰椎骨折患者采用GSS-II复位内固定治疗,并采用X线摄片测定术前术后椎体前、后缘高度.结果

期刊

胸腰椎脊柱骨折骨折固定术内固定器

肺结核肉芽肿与肺癌CT影像鉴别诊断分析

目的探讨肺结核肉芽肿与肺癌CT影像的鉴别诊断要点.方法回顾性分析经病理证实的47例肺结核肉芽肿和31例肺癌患者的CT影像资料.结果病灶的部位、大小、边缘、密度、周围组

期刊

肺结核球肺癌影像鉴别诊断

中型商用车CA6SH-NE3天然气发动机的开发

为了开发满足国Ⅲ排放要求的天然气发动机,研究了实现国Ⅲ标准存在的问题,确定了理论空燃比加三元催化器的技术方案,即采用多点顺序喷射闭环控制空燃比,改进燃烧室和进气系统

期刊

中型商用车天然气代用燃料发动机

后半规管良性发作性位置性眩晕的治疗方法

目的对比分析两种不同复位方法治疗后半规管良性发作性位置性晕眩( PC - BPPV)的疗效.方法将65例后半规管良性发作性位置性眩晕患者,随机分为两组,分别应用改良Epley半规管

期刊

后半规管良性发作性位置发生眩晕治疗

改进PTS算法降低OFDM峰均功率比的研究

针对正交频分复用（OFDM）系统的高峰均功率比值（PAPR）的问题，对传统的部分传输序列（PTS）算法进行了改进。把传统的只进行相位的扰动改进为相位和幅度同时作用，改善了系统的PAPR性能。

期刊

正交频分复用部分传输序列峰均功率比低复杂度

护理干预减少低分子肝素钙注射不良反应

目的:探讨减少低分子钙注射不良反应发生的有效护理方法.方法:将134例确诊冠心病病人按低分子肝素钙注射时护理措施不同随机分为两组,观察两组不良反应发生的情形.结果:选择

期刊

低分子肝素钙护理不良反应

城市规划中景观规划探析

城市规划是在塑造一个城市的灵魂,是对一个城市的文化与魅力的准确解读。可以说一个城市所展现出来的风格与神韵都尽在规划师们的手中,一个成功的规划为城市带来无限的生机与

期刊

城市景观生态规划生境方法

Three-dimensional pharmacophore screening for fentanyl derivatives

Fentanyl is a highly selective μ-opioid receptor agonist with high analgesic activity. Three-dimensional pharmacophore models were built from a set of 50 fenta

期刊

fentanylgenetic algorithm with linear assignment of hypermolecular alignment of

Simulation Study of the Dendritic Effect on Direct MRI Detection of Neural Electric Event

Currently hemodynamic-based functional MRI technique is of limitation in temporal resolution.As neural activities in the brain accompany with current induced ne

期刊

Dendrite branchmagnetic resonance imaging (MRI)neural activityneuronal magnet

分布式媒体服务系统结合请求调度的接入控制研究

由于多媒体业务需要更大的带宽和更高的实时性,所以对服务系统和接入控制提出了更高的要求。文章针对分布式媒体服务系统提出了一种新颖的接入控制方法,与以往方法不同之处在

期刊

POMDP接入控制请求调度梯度优化POMDPadmission controlrequest schedulingpolicy-gradient

基于强化学习的交叉口交通低排放信号控制研究

与本文相关的学术论文