TR-light:基于多信号灯强化学习的交通组织方案优化算法

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:zhuanzhiboke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多变环境条件下的交通堵塞问题,将强化学习、神经网络、多智能体和交通仿真技术结合起来,提出了用于优化多路口条件下交通状况的traJectory reward light(TR-light)模型.该方法具有几个显著特点:基于红绿灯拟定交通组织方案;将多智能体强化学习用于红绿灯控制;通过红绿灯的协同达到区域级的交通组织优化;在智能体每次行为执行结束后实施轨迹重构,在OD对不改变的情况下改变车辆行驶路径,根据方案和重构轨迹来计算智能体的最终回报.通过SUMO进行交通仿真实验和交通指标对比,验证了该模型在多交叉口中能够提高路网畅通率,改善交通状态.实验表明该模型可行,可有效缓解交通拥堵.
其他文献
中文短文本分类中存在大量低频词,利用好低频词中的信息能有效提高文本分类效果,针对基于词向量的文本分类研究中低频词不能被有效利用的问题,提出一种针对低频词进行数据增强的方法.首先,利用受限文本生成模型产生的数据来微调低频词的词向量,再利用一种词向量的构造算法将高频词的更新信息迁移到低频词中,使低频词获取更准确且符合训练集分布的词向量表示;其次,引入相似词和实体概念等先验知识来补充上下文信息;最后,利用改进的卡方统计去除明显的噪声词,以及设计词注意力层对每个词进行加权,减少无关噪声对分类的影响.在多个基础分类
对于异步场景下的数据关联,通过时间配准将异步点迹集合同步化的方法计算复杂且误差较大,严重影响关联效果.在不进行时间配准的前提下,提出一种基于集合经验模态分解(Ensemble Empirical Mode Decom-position,EEMD)来提取趋势项的异步点迹关联方法.仿真结果表明,该方法整体上的关联效果好于基于时间配准后的KN N算法.在目标数量适中的场景下有较好的关联效果.