群体Agent合作求解方法的研究

来源 :清华大学 | 被引量 : 0次 | 上传用户：birdlay

【摘要】

：

群体Agent合作是多Agent系统(MAS)研究的重要问题之一,也是MAS问题的一种有效的求解方式。针对群体Agent合作求解研究工作中存在的问题,本文主要研究了群体Agent合作求解模型

【作者】

：

张双民

【出处】

：

清华大学

【发表日期】

：

2004年期

【关键词】

：

多Agent系统群体Agent合作求解再励学习马尔可夫决策过程

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

群体Agent合作是多Agent系统(MAS)研究的重要问题之一,也是MAS问题的一种有效的求解方式。针对群体Agent合作求解研究工作中存在的问题,本文主要研究了群体Agent合作求解模型、合作求解方法以及合作策略评估等问题。包括:(1)给出一种基于模态算子的群体Agent合作求解逻辑模型将群体Agent的BDI思维属性模型与外部环境状态相结合,给出MAS语言语法、语义模型和相关的定义和公理;按照有能力做、适合做和可以做三种不同的能力表现形式,对Agent能力进行分层描述,利用模态算子重新定义合作求解过程,并给出有关任务分解分配过程的描述,部分改进了Koller等人的工作。(2)给出群体Agent合作求解策略的表示与评估利用影响图建立群体Agent合作求解模型;运用基于情景演算的并发程序语言—ConGolog描述群体Agent联合策略;同时以ConGolog的结构化操作语义为依据,给出联合策略的评估算法;并证明在自然反馈互异的求解模型中,评估算法仍然能够正确评价不同的联合策略。(3)给出一种基于角色跟踪的再励学习方法将单Agent再励学习推广为群体Agent再励学习,在学习模型中引入角色属性,提出一种基于角色跟踪的群体Agent再励学习算法,研究算法的理性和收敛性,并进行了实验分析,部分改进了Bowling和Littman等人的工作。(4)给出一种基于特征向量提取的可分解马尔可夫决策过程模型的方法针对可分解马尔可夫过程模型的特点,通过提取状态特征向量近似状态效用函数,从线性规划和再励学习两种求解角度分别进行约束不等式组的化简和状态效用函数的高维移植,并以机器人足球赛任意球战术配合为背景验证基于特征向量的再励学习算法的有效性和学习结果的可移植性,部分改进了Gestrin等人的工作。

其他文献

起步晚性能优市场大——我国预应力钢筒混凝土管（PCCP）发展现状综述

预应力钢筒混凝土管（Prestressed Concrete Cylinder Pipe，简称PCCP）在国外已有60多年的发展史，我国于20世纪80年代才开始研制，生产PCCP起步较晚，仅有10多年的历史。但由于国民经济

期刊

预应力钢筒混凝土管性能生产企业PCCP综述市场城市化进程PIPE

数据中心网络节能路由研究

为了满足云计算应用对网络带宽和可靠性的需求，近年来已提出许多新型的数据中心网络体系结构，它们使用丰富的网络资源互连服务器，以提供高性能和高容错的路由转发服务。然而这些

学位

数据中心网络能耗模型网络能效节能路由节能流调度

会议代表参观循环经济试点单位北京水泥厂

在举行建筑材料行业发展循环经济现场交流会期间，参会代表参观了北京水泥厂有限责任公司。工业废弃物无害化处置及综合利用是北京水泥厂有限责任公司发展循环经济的重点实施项

期刊

北京水泥厂循环经济试点单位有限责任公司建筑材料行业无害化处置工业废弃物国家发改委

颈前入路颈椎围手术期功能锻炼

目的:探讨颈前入路颈椎手术,术前、术后的功能锻炼。方法:对患者进行术前、术后心理护理,功能锻炼训练。结果:手术顺利,术后患者无并发症发生。结论:围手术期进行有效地功能

期刊

颈前入路围手术期功能锻炼

电力电气设备状态检修技术

基于电力电气设备状态检修技术的重要性,重点介绍了状态检修技术内容,包括变压器局部放电监测技术、变压器油气色谱分析技术、变压器绝缘状态监测技术、红外检测技术、超声波

期刊

电力电气设备状态检修技术应用分析

心电图QT间期离散度与超声心动图对阿霉素心肌病的早期预测价值

目的:探讨QT间期离散度和超声心动图预测阿霉素引起的早期心肌损伤的应用价值。方法:收集2012-01至2013-12期间在我院确诊并有明确病理分型的44例乳腺癌患者,且均采用含蒽环

期刊

QT间期离散度超声心动图阿霉素心肌病早期心肌损伤

旋流微泡浮选柱浮选粒度上限研究

简要介绍了选煤厂存在的浮选入料粒度过粗的问题,分析了旋流微泡浮选柱的分选原理,开创性地采用小于0.7mm煤泥作为入料,通过浮选试验、正交试验分析了各个因素对粗粒回收效果

期刊

粒度上限粗颗粒浮选正交试验

僵尸网络检测方法研究

僵尸网络是被攻击者远程控制、而其用户尚无感知的一群计算机组成的综合攻击平台,已发展为当今互联网的最严重安全威胁之一。僵尸网络区别于传统木马、蠕虫等恶意攻击方式的

学位

僵尸网络地址异常对应关系交互流簇分布相似连接行为模式因特网聊天协议对等网络检测方法

群体Agent合作求解方法的研究

与本文相关的学术论文