【摘 要】
:
Robocup2D仿真平台是一个动态的多智能体对抗体系,在仿真平台上,球员智能体于每一个周期的动作选择将直接决定了球队的攻防能力,而球员在比赛过程中如何相互配合,更精确、快
论文部分内容阅读
Robocup2D仿真平台是一个动态的多智能体对抗体系,在仿真平台上,球员智能体于每一个周期的动作选择将直接决定了球队的攻防能力,而球员在比赛过程中如何相互配合,更精确、快速的到达各自目标点位进行进攻或防守是一切有效策略的前提条件。本文在三角剖分的阵型设计基础上,以防守任务中的智能体动作选择和阵型转换中的球员跑位为工作重点,研究内容如下:首先,将蒙特卡洛树搜索算法引入2D仿真中,将球员智能体在球场上的状态定义为博弈树节点,将双方球员的动作选择视为节点间的状态转移,对于球队的防守任务建立蒙特卡洛树模型。利用极坐标方式对球场进行区域分割,结合Q学习与蒙特卡洛树搜索中的信心上限树算法进行球队训练,将训练结果的动作评估值用于优化比赛代码,得到了一个较为良好的动作选择策略。其次,在分配智能体协调移动问题上提出了一种时间最小化的可扩展角色分配方法,对该方法的不同实现方式进行较为深层次的分析与比较,并将其应用于2D平台中球队攻防转换的阵型实现和球员进攻防守过程中的局部配合跑位上,把球员群体跑位问题模型化,使得球员的跑位更加高效与灵敏,减少了不必要的失误。最后,通过把攻防转换时的状态定义为蒙特卡洛树中的根节点,结合时间最小化角色分配方法进行智能体群防守联合实验,分析实验数据优化代码参数,通过比赛数据证明了方法的有效性。
其他文献
本文对于船舶柴油机-调距桨的单机推进系统和双机推进系统的建模与仿真进行系统的研究。
文中选取MAK9M25柴油机作为建模对象,分别对单机推进系统和双机推进系统进行了
在通信技术迅猛发展的今天,手机已渐渐成为人们工作生活中不可或缺的联系工具,同时伴随着手机的普及,利用手机从事犯罪活动的现象也日益严重,因此为准确把握犯罪动向,严厉打击犯罪
随着移动互联网技术的发展,人们对精确位置服务的要求越来越高。在室外环境中,GPS、北斗等四大卫星系统基本能满足人们的需求,然而在室内遮蔽环境下卫星信号强度和质量急速下
随着空间观测任务的多样化和复杂化以及空间观测技术的不断发展,对日观测作为空间科学的重要任务之一受到广泛关注。高精度对日观测是提升人类对太阳认知的基础。而对日观测
南极科考支撑平台是由我国首座独立研制的极端条件能源支撑平台,突破了我国南极科考受制于澳大利亚的局面,因此具有十分重要的研究意义。讨论了南极科考支撑平台数据采集、处
现在的工业被控对象越来越复杂,并且控制要求不断的提高,为了满足不断提高的生产要求,使得生产过程更加平稳,控制质量更加符合要求,如何准确的寻找到参数模型,并且在此基础上
基于信息技术、神经网络和专家系统,对发动机故障的及时、准确判断,提高汽车发动机工作效率和维修质量是非常重要的。随着汽车的广泛使用,因此研究汽车发动机故障诊断系统具
目前,抑制无陀螺捷联惯导系统(Gyro-Free Strap-down Inertial Navigation System,GFSINS)应用最主要的难题是角速度的精度较低,而影响角速度精度的最大因素是GFSINS中加速度
互联网在近十几年的时间中获得了高速发展,随着用户量的增多和通讯数据量的暴涨,网络拥塞的问题越发突出。所以,设计并优化拥塞控制算法、研究拥塞控制系统的动力学行为,都成
无线传感器网络(WSN)的生命周期受电池能量制约,在满足节点性能要求的前提下,降低各个模块的功耗,从而延长节点寿命是节点级低功耗技术研究的主要内容。目前,环境能量采集技