基于对策与强化学习的多智能体协作机制研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:qingfeng112233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实际系统控制、调度、协作、管理等问题具有复杂和分布式的特征,这就要求各个处理单元应具备自主、自适应、智能化的特性,因此构建多智能体系统成为解决这一类问题的有效途径.但是由于未能找到有效的手段来进行多智能体之间交互的理论研究,多智能体系统本身的一些关键问题仍然没有得到很好的解决,如多智能体的协作机制问题;并且,对多智能体之间协作机制的研究,还缺乏深刻地认识,因而难于建立能够适用于大规模复杂系统的协作机制和协作协议,这就限制了多智能体技术向更复杂问题和更多领域的扩展.鉴于此,该文开展了对复杂多智能体系统内在协作机制的研究.该文以强化学习为出发点,以Markov对策论为智能体之间交互的框架,研究了在分布式环境中智能体的协作所面临的信息不完备、实时决策和模糊不确定性问题.
其他文献
该文设计开发了一种用于出租车调度的语音合成系统,该系统基于CELP格式的语音合成技术,既可以发音阅读信息又可以通过LCD屏显示信息,并可以通过键盘回应信息.该项目解决了出
作者在攻读博士学位期间,先后参与了"九五"国家重点科技攻关项目"工业过程实时控制与优化商品化软件开发与研究"和国家重点基础研究发展规划项目(973)"信息技术中应用理论和
能源系统的安全运行是大型钢铁企业正常生产的保证.该文中通过对专家系统中各种知识表示方法的研究,选择产生式知识表示法对电网结构进行建模.对电网结构进行产生式知识描述
该文围绕着一种保健啤酒的开发展开两方面的研究,其一是配方试验、工艺优化问题,另一个是生产过程中的质量控制问题即统计过程控制问题.对微型啤酒生产线的生产工艺、硬件配
该文从地图扫描图像入手,在研究各类图纸输入方法及软件的基础上,提出了一整套针对大比例尺城市地图的识别方法,其中包括地图图像采集方法、改进的图像二值化方法、交互式识
目前,广泛采用的网络系统安全技术主要有:防火墙技术、入侵检测技术和防病毒技术.防火墙技术主要是应用于专用网络与公用网络的互联环境之中,根据企业的安全策略控制网络的信
对工业生产过程进行有效的控制是提高工业产品的质量,节约原材料的消耗,提高投入产出比的有效手段和途径,是工业技术革命的重要组成部分,对进行高效的工业生产具有十分重要的
该课题介绍一种基于电话网络传输技术的环境管理信息系统,该系统不仅可以实现现场污水排放量的准确测量,而且可以实现对各污处设施的实时远程监控.除此之外,该系统还可以实现
作为脑图像处理与分析的基础,脑图像配准与分割是医学图像分析领域中最基本的问题,也是医学图像分析领域的研究热点.该文从脑图像分析中最根本的任务刚体图像配准方法开始,对
电子束曝光技术是目前制造亚微米高分辨率微细图形的主要手段.该课题主要研究EeBES-40A型光栅扫描电子束曝光机真空及换片机构的工作原理和计算机控制系统.该文首先综述了微