应用记忆演化学习的Agent协商研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户：weigangming

【摘要】

：

在多Agent系统（MAS）环境中，协商是一个复杂的动态交互过程。如何提高协商效率，成为了研究者关注的焦点。应用记忆演化理论的强化学习思想，提出一种Agent协商算法。它与基本强化学

【作者】

：

廉佐政王海珍邓文新滕艳平

【机构】

：

齐齐哈尔大学计算中心,齐齐哈尔大学计算机与控制工程学院

【出处】

：

计算机工程与应用

【发表日期】

：

2009年19期

【关键词】

：

记忆演化协商算法强化学习 memory-evolution negotiation algorithm reinforcement leaning

【基金项目】

：

黑龙江省教育厅项目（the Heilongjiang Province Office of Education Foundation of China under Grant No.11531422）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在多Agent系统（MAS）环境中，协商是一个复杂的动态交互过程。如何提高协商效率，成为了研究者关注的焦点。应用记忆演化理论的强化学习思想，提出一种Agent协商算法。它与基本强化学习相比，3阶段的记忆演化的强化学习，使得Agent可以在实时回报与延迟回报间更好的做出平衡，并为Agent记忆社会化交互创造条件，使强化学习更适合MAS的要求。通过模拟实验证明该协商算法是有效性的。

其他文献

网络组织信息共享的演化博弈研究

根据管理系统工程理论，网络组织具有自主性、动态性、经济性和可扩展性等特点，针对当前网络组织信息共享研究的微观、静态等局限性，运用演化博弈理论方法，建立了一个网络组织信息

期刊

网络组织信息共享演化博弈network organizationinformation-sharing evolutionary game

鼻外伤致脑血管损伤漏诊1例

本文对1例鼻外伤致脑血管损伤患者初期漏诊的原因进行了详细的分析和总结。该例患者在初期漏诊的原因为:(1)颅底骨折未引起足够重视。(2)存在人情看病,没有客观对待疾病。该

期刊

鼻外伤脑血管损伤漏诊

网络中心战还有多远?

当网络中心战(NCW:Network Centric Warfare)的概念在二十世纪末达到流行的顶峰时,它似乎成为改变战争形态的代名词。网络中心战的目标是利用各种传感器收集高度复杂的战场态

期刊

一类周期切换控制稳定的算法设计

利用切换控制及凸组合弱化控制系统稳定性条件，使组合和满足Hurwitz条件而实现切换稳定。该文对切换系统的表达形式、切换信号及切换路径、切换收敛、稳定性判断准则及周期切

期刊

周期切换切换率凸组合稳定性periodic switchedswitched lawconvex combinationstability

基于身份具有错误容忍的会议密钥分配协议

利用Yang等人的一个基于身份的并且错误容忍的会议密钥分配方案,提出了一种改进的会议密钥分配协议算法,并分析了该协议的正确性和安全性。分析结果表明,该方案不但实现了即

期刊

基于身份错误容忍会议密钥identity-based fault-tolerant conference key

小波包分解和模糊聚类下的基因表达数据分析

针对基因表达数据中存在的噪声对聚类分析结果准确度的影响问题，提出了一种基于小渡包分解的基因表达数据模糊聚类分析方案，介绍了理论根据和算法，给出了Matlab仿真结果，并与其他

期刊

基因表达数据小波包分解模糊C-均值聚类最优小波包基gene expression datawavelet packet decompositionfuz

改进的求解线性方程组的并行Arnoldi方法

以Galerkin原理为基础，提出了求解循环块三对角线性方程组的并行算法。根据系数矩阵的稀疏性，选取适当的子空间的基，使算法不但不会发生中断，并从理论上证明了当系数矩阵对称正定

期刊

循环块三对角线性方程组并行算法Arnoldi方法cycle block-tridiagonal linear equationsparallel algo

双源双能量CT增强鉴别肺纯磨玻璃结节浸润前病变与浸润性病变

目的利用双源双能量CT增强及轴冠矢三平面测量纯磨玻璃结节(pGGN)的定量参数,探讨其鉴别pGGN样肺浸润前病变与浸润性病变的可行性及对临床应用价值。方法收集我院经病理证实

期刊

双源双能量CT肺腺癌纯磨玻璃结节增强

有效提取耳语音共振峰的改进方法

耳语音是噪声源激励，与正常音相比，其共振峰位置发生了偏移，带宽增宽。故采用传统的线性预测法提取耳语音共振峰时存在虚假峰问题。通过分析功率谱，提出了一种改进算法。根据极点

期刊

耳语音共振峰线性预测编码极点交互whispered speechformantliner prediction codingpole interacti

疏肝止痛汤联合三联疗法对幽门螺杆菌相关性消化性溃疡患者肠道微生态改变的影响

消化性溃疡主要是指发生在胃和十二指肠的慢性溃疡,溃疡形成与幽门螺杆菌(Hp)感染有直接关系,幽门螺杆菌感染可直接或间接作用于G、D细胞和壁细胞,导致胃酸分泌增加,胃内pH值

期刊

疏肝止痛汤三联疗法幽门螺杆菌感染消化性溃疡肠道微生态

应用记忆演化学习的Agent协商研究

与本文相关的学术论文