多Agent系统强化学习及其在CAS仿真建模中的应用

来源 :东北电力大学 | 被引量 : 0次 | 上传用户:hqxt2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多Agent系统(MAS)及其相关技术近年来受到越来越多的研究者的关注,被广泛应用到Internet、办公自动化、冲突协调、决策支持、开放式信息系统等众多领域。其中基于Agent的仿真建模(ABMS)是当前仿真与建模领域研究的热点,它是研究复杂适应性系统的主要手段。 强化学习不需要导师训练,仅通过试错法即可找到最优解或者接近最优解,是比较重要的一种机器学习方法,在马尔可夫决策过程等坚实的数学理论支持下,获得了成功。进一步将强化学习理论应用到多Agent系统(多Agent系统强化学习)是现在研究的热点和难点。 论文研究了多Agent系统理论,并对强化学习中的Q学习进行了重点研究,单个Agent的Q学习算法同样不能直接应用到多Agent系统中,本文提出Agent间通过对信息的共享,有效地将Q学习算法扩展应用到多Agent系统,提出了改进的多Agent系统强化学习方法。 多Agent系统理论非常适合应用于复杂适应性系统研究中,论文对一个复杂系统——人工神经网络的构建方法进行了分析和研究。将组成神经网络的神经元封装成Agent,通过Agent之间的交互完成神经网络相应的功能,提出了基于多Agent系统的人工神经网络的构造方法。这为神经网络的分布式实现提供了一条新途径。 同时,在基于MAS的神经网络中,将强化学习算法运用到调整网络权值算法中,实验效果比较明显。
其他文献
随着企业信息化的迅猛发展,越来越多的企业选择软件管理系统来支持企业中的各种活动,企业管理软件在企业管理中扮演越来越重要的角色。但是随着企业活动的多样化,单一的系统安全
本文针对信息战中无人飞行器嵌入分布控制的高可靠性要求,研究适合异构嵌入分布计算平台的多模式容错技术,为平台可靠性研究奠定了基础。 根据系统的模块化、并行性和自治性
随着计算机技术和通信技术的发展,即时消息技术(Instant Message)越来越受到人们的关注,在企业信息化、电子政务和个人通信等领域得到广泛的应用。在电力监控管理系统越来越复
近年来,移动数据增值业务无论是从用户规模还是业务规模都有了长足发展,随之而来的业务数据管理的需求量也与日俱增。这就对面向移动数据增值业务运营的公司提出了提高自身的业
目前,很多学者都在尝试用不同的方法来求解Job-Shop调度问题。但是由于Job-Shop调度问题本身的复杂性,每种方法都存在着不足之处,如方法比较复杂或解的近优性较差。借鉴操作
在数据挖掘中,分类是一种重要的技术,它能对大量有关数据进行分析、学习,并建立相应问题领域中的分类模型。该技术在科学、工程、金融等领域均有广泛的应用。本文介绍了文本
随着软件行业的迅猛发展,软件外包业务的不断扩大,人们对掌握软件成本估算方法的需求越来越迫切。而软件规模估算作为软件成本估算的一个重要基础,也日益受到广泛的关注。 本
微博是近年新兴的网络媒体传播平台,它具有内容简短、传播速度快、用户众多等特点,而对于微博文本的情感分析是近年来数据挖掘的热点之一,具有重要意义和价值。用户在实施网上购
本文分析了无线传感器网络的体系架构,并跟踪国内外在无线传感器网络协议领域的最新进展,对网络层和MAC层的几个比较流行的协议进行了比较与总结。文章着重介绍了CBIR路由协议
随着无线数据通信技术的日益成熟,基于IEEE 802.11协议的无线局域网接入技术以其安装便捷、组网灵活、可移动性、成本低廉、可扩展性强等优点在近几年表现出良好的发展势头。