基于记忆演化的多Agent系统强化学习

来源 :清华大学 | 被引量 : 0次 | 上传用户：ccscbr66

【摘要】

：

该论文从多Agent系统与强化学习结合的角度,在认知科学中3阶段记忆演化模型的基础上,提出了一种新的强化学习:基于记忆演化的MAS强化学习.与传统的MAS强化学习方法不同,该方

【作者】

：

常乐

【机构】

：

清华大学

【出处】

：

清华大学

【发表日期】

：

2002年期

【关键词】

：

记忆演化模型 MAS强化学习自适应负载均衡模型车间作业调度

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

该论文从多Agent系统与强化学习结合的角度,在认知科学中3阶段记忆演化模型的基础上,提出了一种新的强化学习:基于记忆演化的MAS强化学习.与传统的MAS强化学习方法不同,该方法是从个体Agent的记忆演化出发,依照人类记忆演化中瞬时记忆阶段、短期记忆阶段和长期记忆阶段的不同特性,设计出强化学习的基本模块,使其达到对外界信息的分阶段加工处理,实现实时回报和延迟回报目标、知识发现与知识利用之间的平衡,最终利用个体记忆的社会化演化,实现多Agent系统的整体目标.

其他文献

燃煤蒸汽锅炉燃烧系统自动控制的研究

该文研究了燃煤锅炉燃烧系统的自动控制问题.首先简述了燃煤锅炉的工艺流程、特点及调节系统的任务;分析了燃烧系统调节对象的特性.根据工艺特点,把燃烧控制分成主汽压控制、

学位

PID控制SMITH预估控制模糊控制燃煤锅炉燃烧控制自寻优控制

无线网络系统的建模及拥塞控制问题研究

TCP(Transmission Control Protocol)协议由于能够提供可靠的端到端的传输服务,保障网络的通信性能,人们对其进行了大量的研究,同时,无线网络由于能够满足人们随时随地上网的

学位

无线网络拥塞控制ECN机制带宽估计模型改进PI控制

面向JPEG2000的二维DWT的VLSI设计与仿真

该文首先对双正交小波变换进行了详细的理论分析和讨论,在此基础上用VC实现了小波分解和重构的软件仿真,同时也对双正交小波和对称延伸技术进行了验证.然后在详细分析和讨论

学位

二维离散小波变换双正交小波滤波器超大规模集成电路JPEG2000

坦克火控优化设计智能决策支持系统

该文正是针对上述问题开展了如下研究工作.（1）首先阐明了课题研究的目的和意义;由于坦克火控系统设计中的复杂性,需借助复杂系统研究的方法论和具体的研究方法,来解决坦克火控

学位

坦克火控系统复杂系统智能决策群决策并行工程

基于CAN总线技术在典型控制系统中的应用研究

该文前一部分讨论了利用北京华控RSM（核心是CAN总线）非智能模块及其分布式系统（SDS）在驱动控制、顺序控制和过程控制系统中的实际应用.作为驱动控制的控制对象是直流电机,采用PWM

学位

现场总线FCSCANDDE驱动控制顺序控制过程控制PWM二次开发

车用闪光继电器电寿命试验方法与装置的研究

车用电器的可靠性直接影响整车的性能和质量,因此,行业内对车用电器试验与检测方法的研究非常重视。车用闪光继电器是关系到车辆行车安全的重要电子器件,主要用于车辆的转弯

学位

车用闪光继电器电寿命试验模拟负载性能参数失效分析

供应链环境下易逝品的最优库存控制

伴随着全球经济的高速发展,供应链管理逐渐成为增强企业竞争力的重要方法之一,其中库存控制作为供应链管理中极为关键的一个环节,引起了企业界和学术界的广泛关注.而科技的发展和人们生活水平的提高极大增加了易逝性产品在市场中所占的比例,此类产品的损耗特征使得库存控制的难度增大,能否合理的生产或再利用这些易逝性产品与当代企业的利益与社会的可持续发展息息相关.本文首先建立了包含易逝品的单产品生产系统的库存模型,

学位

供应链库存控制易逝品库存依赖性需求回收与再制造

伺服柔性仿形自动喷涂系统控制软件的研究与开发

“柔性仿形自动喷涂系统研制”是国家863重点项目之一，本文主要介绍了此系统控制软件的研制和开发过程，及应用的基础理论和关键技术。柔性仿形自动喷涂系统是为适应汽车产

学位

柔性仿形轨迹规划模糊控制喷涂

基于小波分析的分布参数系统控制的若干问题研究

该文将Haar小波作为正交函数系,利用正交函数逼近方法,提出了基于小波分析的分布参数系统控制的几种新的有效的方法.该文主要研究成果包括以下几个方面：1.推导出了Haar正交小

学位

分布参数系统小波分析最优控制

RoboCup仿真比赛系统的研究

多智能体系统(Multi-Agent System，MAS)的研究已经成为计算机科学和人工智能研究的热点。多智能体系统是多个智能体的集合。它主要研究了多个智能体在复杂的动态环境下如何实

学位

多智能体足球机器人路径规划仿真策略RoboCup

基于记忆演化的多Agent系统强化学习

与本文相关的学术论文