RoboCup3D仿真中足球机器人的全向行走与团队协作

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:getu0217
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以RoboCup3D足球仿真比赛环境为平台,主要研究了南京邮电大学Apollo3D团队有关足球机器人个体技术和多智能体团队协作对抗策略。先后实现了单个智能体的全向行走技术、机器人之间的协作定位技术以及多智能体团队协作对抗策略。本文的研究内容主要有以下三点:(1)首先,描述了仿真足球机器人队伍——Apollo3D全向行走动作的设计。提出一种基于双线性倒立摆模型、零力矩点(ZMP)以及躯干陀螺仪提供的信息来预测控制机器人的步行运动,然后利用CMA-ES学习算法对步行参数进行分层学习,通过设计奖惩函数和训练任务达到最好的优化效果,全面提升了机器人行走、转弯和带球的灵活度和稳定性,最终实现了复杂环境中双足机器人快速稳定的全向行走。(2)其次,针对RoboCup3D仿真中双足机器人单个机器人定位,即在陀螺仪定位,三个标志杆定位及粒子滤波定位前提下,提出一种基于改进粒子群优化(PSO)算法的机器人协作定位方法。该方法将Apollo3D队伍之前用到的粒子滤波定位算法与PSO优化算法相结合,通过PSO优化算法对足球机器人速度和位置信息进行更新,同时还利用了足球机器人之间的相互观测量,调整粒子的建议分布及其权值。针对机器人绑架模式,设计sloww和fastw两个参数来跟踪粒子权重平均值的长期和短期的变化,最终实现了机器人之间的协作定位。(3)最后,提出一种基于keepaway强化学习的多智能体协作策略。Keepaway3 vs.2是由Peter Stone提出的一种局部战术策略,该策略运用在2D仿真比赛中。本文在此基础上建立3D仿真中的Keepaway训练模型,并将线性函数近似的Sarsa(?)学习算法运用到该训练模型中,实现机器人协作对抗最优策略分配,包括传球(PASS)、跑位(GETOPEN)等策略。
其他文献
异步电动机广泛应用于工矿企业,它是各种电动机中应用最广、需求量最大的一种电机。据统计,电网的总负载中动力拖动约占60%,动力负载的绝大部分是三相交流异步电动机,因此它的保护问题长期以来受到人们的关注。近年来,随着计算机技术与电子技术的不断发展,出现了以微处理器为核心的电动机综合保护系统。这种新型的保护系统与传统的保护系统相比,具有强大的逻辑分析与数据处理功能、故障记录与故障分析功能以及易于实现网络
随着现今科技的迅猛发展,多视图数据越来越普遍地存在于人们的生活中。这一方面为机器学习算法能够利用具有多样性的数据,更好地揭示模式内在本质特性带来了新的契机。另一方
学位
MR阻尼器控制系统是专为精确控制MR阻尼器输出阻尼力而设计的可控恒流控制源装置。目前,现有的MR阻尼器控制装置由于输出电流较小,控制功率偏小,只适合于小阻尼力MR阻尼器。同时MR阻尼器控制算法与可控恒流控制源不能很好地结合,因此在一些工程实践中限制了MR阻尼器的应用。随着我国社会、经济的迅速发展,在国民经济的许多方面,尤其是在大型工程减震方面迫切需要大型MR阻尼器的投入使用。设计与之相配套的输出电
钢水温度是炼钢过程的重要控制指标,由于钢水温度过高和钢液、钢渣对测温枪的腐蚀,钢水温度的测量只能用热电偶进行消耗式点测,而无法得到钢水温度的连续变化的信息。如何建
模糊控制技术作为一种控制方法,能有效地处理精确数学模型难以建立的复杂系统,已引起广泛关注。本文针对当前Takagi-Sugeno(T-S)时滞模糊系统的研究现状及存在的问题,在深入研
相关滤波器或匹配滤波器(Matched Filter,Correlation Filter)是能够用于在背景噪声特别是高斯白噪声和几何扭曲情况下的已知目标物体识别中应用最广泛的线性滤波。相比于其他
网络结构和传播行为的相互关系是复杂网络病毒传播中非常重要的方面。研究网络结构和传播演化过程,有助于揭示各种病毒爆发现象在网络结构层面的决定因素。对进一步揭示和认
欠驱动机械系统是指系统的独立控制变量个数小于系统自由度个数的一类非线性系统。其特点是输入空间(即控制空间)维数小于构造空间维数。同时,欠驱动部分的约束方程又是不可积
传统的卸货方式有后卸、侧卸等,存在稳定性差、易侧翻和埋胎等不足,底开门漏斗卸货车能很好解决其它卸货方式的不足。目前,底开门自动卸货车已经成为一种趋势,而列车卸货控制