应用记忆演化学习的Agent协商研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:weigangming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在多Agent系统(MAS)环境中,协商是一个复杂的动态交互过程。如何提高协商效率,成为了研究者关注的焦点。应用记忆演化理论的强化学习思想,提出一种Agent协商算法。它与基本强化学习相比,3阶段的记忆演化的强化学习,使得Agent可以在实时回报与延迟回报间更好的做出平衡,并为Agent记忆社会化交互创造条件,使强化学习更适合MAS的要求。通过模拟实验证明该协商算法是有效性的。
其他文献
根据管理系统工程理论,网络组织具有自主性、动态性、经济性和可扩展性等特点,针对当前网络组织信息共享研究的微观、静态等局限性,运用演化博弈理论方法,建立了一个网络组织信息
本文对1例鼻外伤致脑血管损伤患者初期漏诊的原因进行了详细的分析和总结。该例患者在初期漏诊的原因为:(1)颅底骨折未引起足够重视。(2)存在人情看病,没有客观对待疾病。该
当网络中心战(NCW:Network Centric Warfare)的概念在二十世纪末达到流行的顶峰时,它似乎成为改变战争形态的代名词。网络中心战的目标是利用各种传感器收集高度复杂的战场态
期刊
利用切换控制及凸组合弱化控制系统稳定性条件,使组合和满足Hurwitz条件而实现切换稳定。该文对切换系统的表达形式、切换信号及切换路径、切换收敛、稳定性判断准则及周期切
利用Yang等人的一个基于身份的并且错误容忍的会议密钥分配方案,提出了一种改进的会议密钥分配协议算法,并分析了该协议的正确性和安全性。分析结果表明,该方案不但实现了即
针对基因表达数据中存在的噪声对聚类分析结果准确度的影响问题,提出了一种基于小渡包分解的基因表达数据模糊聚类分析方案,介绍了理论根据和算法,给出了Matlab仿真结果,并与其他
以Galerkin原理为基础,提出了求解循环块三对角线性方程组的并行算法。根据系数矩阵的稀疏性,选取适当的子空间的基,使算法不但不会发生中断,并从理论上证明了当系数矩阵对称正定
目的利用双源双能量CT增强及轴冠矢三平面测量纯磨玻璃结节(pGGN)的定量参数,探讨其鉴别pGGN样肺浸润前病变与浸润性病变的可行性及对临床应用价值。方法收集我院经病理证实
耳语音是噪声源激励,与正常音相比,其共振峰位置发生了偏移,带宽增宽。故采用传统的线性预测法提取耳语音共振峰时存在虚假峰问题。通过分析功率谱,提出了一种改进算法。根据极点
消化性溃疡主要是指发生在胃和十二指肠的慢性溃疡,溃疡形成与幽门螺杆菌(Hp)感染有直接关系,幽门螺杆菌感染可直接或间接作用于G、D细胞和壁细胞,导致胃酸分泌增加,胃内pH值