【摘 要】
:
Robocup机器人足球系统是一个典型的多智能体系统,同时也是一个典型的多智能体协作与竞争系统,它为分布式人工智能的研究提供了一个标准的试验平台。多智能体学习与协作是当
论文部分内容阅读
Robocup机器人足球系统是一个典型的多智能体系统,同时也是一个典型的多智能体协作与竞争系统,它为分布式人工智能的研究提供了一个标准的试验平台。多智能体学习与协作是当今人工智能领域研究的难点与热点,机器人足球系统涉及到多个机器人的协同工作,实时性很强,在这种环境下研究智能体的学习问题和多智能体的协作问题具有很大的挑战。本文以全自主的机器人足球为背景,主要针对智能体学习和多智能体协作两方面进行了深入的研究。 在智能体学习方面,考虑到强化学习算法需要离散化状态空间和行为空间,而机器人足球系统是一个连续的空间,如果对所有变量进行离散必然导致维数灾难,且无法在实际系统中实现。在此基础上设计了改进算法,选择只离散化输入状态,同时将强化学习和在线搜索相结合,该方法提高了搜索速度和踢球动作的成效。 在多智能体协作研究方面,针对机器人足球的动态、不确定环境因素对智能体行为、协作的影响,智能体如何在不确定环境下进行协作就成为一个关键的问题。本文详细论述了三种已经应用到机器人足球上的协作模型和框架,分别探讨了他们的优缺点和可行性。 实验与应用研究表明,本文在智能体学习方面所做的算法结合了强化学习和启发式搜索的优点,将其应用到Robocup仿真比赛中的踢球动作设计,得到了令人满意的效果。
其他文献
随着计算机网络的迅猛发展,许多企业和学校都能够通过企业内部网(校园网)迅速获取所需信息。但是这些信息中含有一些非法的、反动的以及不良的信息。为了实时监控和过滤这些信
嵌入式系统应用领域不断扩大,嵌入式计算机系统设计方法的研究也发展到了一新的阶段——软硬件协同设计的方法。一般来说嵌入式系统对产品成本很敏感,而软硬件的划分对最终产品
随着视频点播业务的发展,传统的单点服务器出现了服务器性能有限、存储空间有限与带宽有限等问题,这使VOD系统在规模上有了很大的限制。针对这种情况,人们采取了使用多台分布式
在航空测量领域,运动物体运动参数的非接触式测量是非常重要的研究内容,一般采用视频变形测量(Video Measurement Deformation, VMD)的方法,视频测量技术用于确定三维空间物
在航空测量领域,运动物体的运动参数非接触式测量是非常重要的研究内容,因为在航空器,推进器,武器系统,风洞流场等的性能测试中,往往会遇到难以使用接触式传感器进行测量的情况。随
一个实时系统是指计算的正确性不仅取决于程序的逻辑正确性,也取决于结果产生的时间,如果系统的时间约束条件得不到满足,将会发生系统出错。实时系统有广泛的应用领域,包括多媒体
目前的科研和商用人脸识别系统能够在小规模人脸数据库、用户配合、摄像环境接近理想的情况下获得令人满意和满足一定实际生产要求的结果,但在更大规模人脸数据库、用户不配
本文基于对目前宽带接入网网管实现技术的研究,提出了采用TMN(电信管理网)体系结构和SNMP为接口的统一网管分层体系结构。整个结构从下到上依次为数据交换层、数据分析处理层
Petri网适合于网络环境下的信息处理系统的描述和建模。它的主要特性包括:并行、不确定性、异步及分步描述能力和分析能力。Petri网以其简洁、直观、潜在模拟能力强等特点被
TCP协议是固定网络上有效的端到端传输协议,它在应用于复杂多变的无线网络时性能却大大下降。这主要是由于TCP的错误控制机制不适用于无线网络。针对固定网络设计的标准TCP协