论文部分内容阅读
Agent和多Agent系统(Multi-Agent Systems,简称MAS)正在成为人工智能研究实用化和在分布计算环境下的软件智能化的重要技术。MAS技术的研究主要集中在三个方面:Agent行为理论、Agent体系结构和多Agent协作。其中,多Agent协作主要是研究自动Agent系统如何能够更有效的交互。近年来,协商作为MAS中矛盾处理和冲突消解的一种重要的方法,已经成为MAS系统协作研究中的一个重要的分支。 在MAS的研究中,研究者使用很多方法提高协商模型的适应能力和决策能力,其中很重要的一个方法就是在协商模型中加入学习机制,使得系统的性能得到改善。然而,目前的Agent协商学习算法多存在于协商过程中,在协商前,Agent个体自身信念中对于交互对手的私有信息认知程度还不高。 本文详细分析了MAS中多议题协商过程,简要介绍了协商的概念,对协商各个不同的类型进行了详细地介绍。针对多Agent多议题协商模型内部的学习、决策机制能力的提高问题,对比了多种已经存在的协商Agent学习算法和决策模型。 Agent个体在协商开始前对交互对手信息的认知程度在一定程度上影响了Agent自身的决策效率和最终收益。本文参考Zeng等人提出的协商Agent学习方案,以贝叶斯理论为基础,使用Agent协商系统中在中间平台上存储的对手Agent的协商历史信息,对协商对手的各个议题保留值等私有信念进行预测。并在此基础上,对已有的Agent协商交互机制进行优化,提高Agent个体在协商中的最终收益。最后通过实验证明了工作的有效性。 本文同样以贝叶斯理论为基础,通过协商历史对交互对手的策略进行预测。并以此为基础,在协商模型中运用预测结果,对协商模型进行了优化,使Agent在协商过程中能根据自己的需要来缩短协商进程,同时获得合理的收益,提高协商过程的可控性。最后通过实验证明了工作的有效性。