【摘 要】
:
近年来,有关Multi-agent系统(MAS)与分布式人工智能(DAI)的研究,已经成为人工智能领域的重要研究方向之一。而RoboCup则是以MAS和分布式人工智能为主要研究背景,其使命就是促
论文部分内容阅读
近年来,有关Multi-agent系统(MAS)与分布式人工智能(DAI)的研究,已经成为人工智能领域的重要研究方向之一。而RoboCup则是以MAS和分布式人工智能为主要研究背景,其使命就是促进分布式人工智能与智能机器人技术的研究与教育。该研究方向要求在一个实时动态变化的和不可预测的环境中,拥有自主能力的Agent,作为团队的一部分,能自动地进行有效的动作,完成整个队伍的目标。本文以RoboCup仿真比赛为检验平台,以多智能体系统为研究对象,主要进行了以下工作:首先,选择智能体间协作作为目标任务,在对己有的协作策略进行研究的基础上,分别从静态和动态出发,研究了基于静态阵形和动态阵形的阵形变化策略,有效的增强了球队的整体实力;并且还采用了基于合作意愿矩阵的规划协作策略,很好的改善了球队整体协作进攻能力。其次,由于Q学习不能适用于连续状态空间和动作空间的学习,随着状态空间的增大,Q值在内存中的存储以及查询变得困难,会导致维数灾难,且传统的强化学习不具有泛化能力,这些缺点限制了它在复杂多变的环境中的应用。为了解决这些存在的问题,采用模糊Q学习算法以及基于信度分配模糊CMAC(CA-FCMAC)的Q学习算法,并将算法用于RoboCup仿真比赛中,通过实验证明改进后算法有效的优化了Agent个体技术。最后,在MAS中,由于外部环境提供信息较少,强化学习的学习效率通常较低。采用具有先验知识的算法来优化学习状态,提高学习效率。并结合心理学中的内在激励思想,提出基于先验知识的内在激励强化学习,并将此算法运用到MAS局部配合技术的训练中,实验表明,这种算法能够提高球队的局部协作能力。
其他文献
本论文运用主成分分析法对人类启动子序列进行特征提取,并建立人类启动子识别模型对人类基因序列进行分析,获得较好实验结果。启动子是位于结构基因5’端转录起始点上游的一
在GSM故障诊断中,故障现象和故障原因之间的关系是复杂的、非线性的,它们之间难以建立精确的数学模型,给GSM网络故障诊断人员分析问题、处理问题和解决问题带来很大的难度。
随着我国经济的快速发展,钢铁产业作为国民经济发展的支柱产业,面临着新的挑战与机遇。如何把新的控制技术应用于钢铁产业中,提高产品质量,增强产品竞争力,产生巨大的经济和
图像配准即确定在相同或不同时间、通过相同或不同传感器对同一个地区拍摄的两幅或多幅图像之间关于空间和亮度的最佳匹配关系的过程。图像配准广泛应用在导航定位、目标识别
近年来,由于电力电子技术的发展,开关电源的应用已深入到各个领域,在这些应用中一般要求开关电源具有高质量的输出波形。开关电源输出波形质量主要包括两个方面:一是动态性能好;二是稳态精度高。因此研究既简单又具有优良动、静态性能的开关电源控制方案,一直是电力电子和自动控制领域的研究热点问题。本文针对DC-DC变换器电源系统,根据其物理特性,在开关元件的导通和截止的不同阶段,给出了状态空间平均模型。为了获得
随着信息化、智能化、网络化的发展,嵌入式系统技术获得了广阔的发展空间,成为一个新的技术热点和发展方向。嵌入式系统是以应用为中心,软硬件可裁减的计算机系统,广泛应用于
生物的视觉系统在处理所面对的场景时,可以很轻易的并且准确的选择和提取出最感兴趣的区域,显著图检测技术就是模拟眼睛的感知特性来获取场景中的最感兴趣的区域。近年来,由于显
立体视觉匹配是计算机视觉和非接触测量研究中最基本的关键问题之一,该技术使得通过像点获取距离信息,实现三维立体成为可能,但同时也是最难彻底解决的问题。这其中的重点和
随着复印质量和速度的不断提高,要求复印机各功能部件的性能也随之提高,以适应主机性能的发展要求,研究设计高精度、高速度、高性能的自动输稿器已引起国外复印机研究机构的
近年来,由于人们对图像的要求的逐渐增加,图像融合技术得到了长足的发展。图像融合技术是将多幅具有不同信息的图像融合成一张包含了所有图片的信息图像,具有更加可靠性并且能够