多智能体强化学习在城市交通网络信号控制方法中的应用综述

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:liangjielin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通信号控制系统在物理位置和控制逻辑上分散于动态变化的网络交通环境,将每个路口的交通信号控制器看做一个异质的智能体,非常适合采用无模型、自学习、数据驱动的多智能体强化学习(MARL)方法建模与描述。为了研究该方法的现状、存在问题及发展前景,系统跟踪了多智能体强化学习在国内外交通控制领域的具体应用,包括交通信号MARL控制概念模型、完全孤立的多智能体强化学习(MARL)的控制、部分状态合作的多智能体强化学习控制和动作联动的多智能体强化学习(MARL)控制,分析其技术特征和代际差异,讨论了多智体强化学习方法在
其他文献
在市场经济工作环境日益竞争激烈的今天,基于单位机构的会计信息化建设的具体目标是基本实现大型企事业单位会计信息化与经营管理信息化融合,进一步提升企事业单位的管理水平和
摘要:近年来,随着社会的不断进步以及我国经济迅猛发展,我国国内煤炭市场需求量逐年攀升,随之而来的是煤炭资源储备需大幅度增加,在此形势需求下促进了煤炭地质勘探技术的发展、本
目的观察在腹腔镜快速胆囊切除术(LC)中采用"一钩到底法"的临床效果,分析技术要点和优点。方法回顾性分析2010年12月至2013年10月间收治的1 303例行LC术的患者,其中685例患者术中
本文主要论述的是针对地籍档案利用的多样化提出自己的观点,首先明确了地籍档案的定义,其次传统的地籍档案利用方式相对单一,新时期对于地籍档案利用方式提出了更高的要求和挑战,传统的单一利用方式应向多样化的利用方式转变;为此要转变观念,由上门坐等服务利用者到积极主动为利用者提供服务。充分利用互联网的优势,提供在线的利用服务。地籍档案利用功能不仅局限于提供基本的资料查询,还要为科研、档案编研提供服务。
自上世纪七八十年代以来,国内掀起了研究中算史的高潮,国内学者发表了大量有关中算史的著作或文章。在这些研究成果中,以研究《九章算术》和刘徽的居多。但对于《九章算术》
本文是对作曲家德彪西的钢琴曲《沉没的教堂》的演奏技法与音乐特点进行剖析。通过对手指触键不同方式和与踏板结合运用等的进一步解析,将五彩缤纷的画面与扑朔迷离的意境展现
目的:了解我镇14岁以下独生子女的生长发育和健康状况,探讨儿童合理健康的饮食生活习惯。方法对石龙镇14岁以下的儿童进行免费的体检,对检查结果建立Excel表格数据库并进行描述