论文部分内容阅读
群体Agent合作是多Agent系统(MAS)研究的重要问题之一,也是MAS问题的一种有效的求解方式。针对群体Agent合作求解研究工作中存在的问题,本文主要研究了群体Agent合作求解模型、合作求解方法以及合作策略评估等问题。包括:(1)给出一种基于模态算子的群体Agent合作求解逻辑模型将群体Agent的BDI思维属性模型与外部环境状态相结合,给出MAS语言语法、语义模型和相关的定义和公理;按照有能力做、适合做和可以做三种不同的能力表现形式,对Agent能力进行分层描述,利用模态算子重新定义合作求解过程,并给出有关任务分解分配过程的描述,部分改进了Koller等人的工作。(2)给出群体Agent合作求解策略的表示与评估利用影响图建立群体Agent合作求解模型;运用基于情景演算的并发程序语言—ConGolog描述群体Agent联合策略;同时以ConGolog的结构化操作语义为依据,给出联合策略的评估算法;并证明在自然反馈互异的求解模型中,评估算法仍然能够正确评价不同的联合策略。(3)给出一种基于角色跟踪的再励学习方法将单Agent再励学习推广为群体Agent再励学习,在学习模型中引入角色属性,提出一种基于角色跟踪的群体Agent再励学习算法,研究算法的理性和收敛性,并进行了实验分析,部分改进了Bowling和Littman等人的工作。(4)给出一种基于特征向量提取的可分解马尔可夫决策过程模型的方法针对可分解马尔可夫过程模型的特点,通过提取状态特征向量近似状态效用函数,从线性规划和再励学习两种求解角度分别进行约束不等式组的化简和状态效用函数的高维移植,并以机器人足球赛任意球战术配合为背景验证基于特征向量的再励学习算法的有效性和学习结果的可移植性,部分改进了Gestrin等人的工作。