基于记忆演化的多Agent系统强化学习

来源 :清华大学 | 被引量 : 0次 | 上传用户:ccscbr66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文从多Agent系统与强化学习结合的角度,在认知科学中3阶段记忆演化模型的基础上,提出了一种新的强化学习:基于记忆演化的MAS强化学习.与传统的MAS强化学习方法不同,该方法是从个体Agent的记忆演化出发,依照人类记忆演化中瞬时记忆阶段、短期记忆阶段和长期记忆阶段的不同特性,设计出强化学习的基本模块,使其达到对外界信息的分阶段加工处理,实现实时回报和延迟回报目标、知识发现与知识利用之间的平衡,最终利用个体记忆的社会化演化,实现多Agent系统的整体目标.
其他文献
该文研究了燃煤锅炉燃烧系统的自动控制问题.首先简述了燃煤锅炉的工艺流程、特点及调节系统的任务;分析了燃烧系统调节对象的特性.根据工艺特点,把燃烧控制分成主汽压控制、
TCP(Transmission Control Protocol)协议由于能够提供可靠的端到端的传输服务,保障网络的通信性能,人们对其进行了大量的研究,同时,无线网络由于能够满足人们随时随地上网的
该文首先对双正交小波变换进行了详细的理论分析和讨论,在此基础上用VC实现了小波分解和重构的软件仿真,同时也对双正交小波和对称延伸技术进行了验证.然后在详细分析和讨论
该文正是针对上述问题开展了如下研究工作.(1)首先阐明了课题研究的目的和意义;由于坦克火控系统设计中的复杂性,需借助复杂系统研究的方法论和具体的研究方法,来解决坦克火控
该文前一部分讨论了利用北京华控RSM(核心是CAN总线)非智能模块及其分布式系统(SDS)在驱动控制、顺序控制和过程控制系统中的实际应用.作为驱动控制的控制对象是直流电机,采用PWM
车用电器的可靠性直接影响整车的性能和质量,因此,行业内对车用电器试验与检测方法的研究非常重视。车用闪光继电器是关系到车辆行车安全的重要电子器件,主要用于车辆的转弯
伴随着全球经济的高速发展,供应链管理逐渐成为增强企业竞争力的重要方法之一,其中库存控制作为供应链管理中极为关键的一个环节,引起了企业界和学术界的广泛关注.而科技的发展和人们生活水平的提高极大增加了易逝性产品在市场中所占的比例,此类产品的损耗特征使得库存控制的难度增大,能否合理的生产或再利用这些易逝性产品与当代企业的利益与社会的可持续发展息息相关.本文首先建立了包含易逝品的单产品生产系统的库存模型,
“柔性仿形自动喷涂系统研制”是国家863重点项目之一,本文主要介绍了此系统控制软件的研制和开发过程,及应用的基础理论和关键技术。 柔性仿形自动喷涂系统是为适应汽车产
该文将Haar小波作为正交函数系,利用正交函数逼近方法,提出了基于小波分析的分布参数系统控制的几种新的有效的方法.该文主要研究成果包括以下几个方面:1.推导出了Haar正交小
多智能体系统(Multi-Agent System,MAS)的研究已经成为计算机科学和人工智能研究的热点。多智能体系统是多个智能体的集合。它主要研究了多个智能体在复杂的动态环境下如何实