【摘 要】
:
RoboCup机器人世界杯赛是近年来规模最大并且参与人数最多的高智能机器人足球比赛,其中仿真2D组比赛更是RoboCup世界杯中最古老的比赛项目之一,其中的多agent智能系统协作问
论文部分内容阅读
RoboCup机器人世界杯赛是近年来规模最大并且参与人数最多的高智能机器人足球比赛,其中仿真2D组比赛更是RoboCup世界杯中最古老的比赛项目之一,其中的多agent智能系统协作问题也是当前最热门的研究方向之一。它为研究人员提供了一个标准的比赛平台、命令和动作接口。RoboCup联盟期望通过提供这样的一个标准问题,鼓励研究人员通过各种技术手段来获得人工智能和MAS(Multi-agent System,多智能体系统)方面的解决方案,并且可以通过该平台进行测试和实践。在RoboCup联盟提供比赛平台的基础上,各个学校和研究机构开始研究学习算法,使得每个agent具有一定的学习能力,这样才能保证在比赛中球队能立于不败之地,其中Q学习是最广泛采用的学习算法之一。本文在Q学习基础上对球队的改进如下:1、采用随机对策的决策过程来代替单agent的马尔可夫决策过程以解决MDP决策过程不能对球场的状态变化有很好的反应的问题2、根据随机对策的内容将复杂的球场环境分成三种情况分别讨论(自己控球,我方控球和对方控球),并确定每种情况对应不同的状态-动作对。3、通过对球场的精确划分和采用相应的补充控制方法,来对Q学习中的关键参数奖赏值进行计算以确保奖赏值的连续性和单调性,同时根据此参数和改进的算法来更新Q值使得机器人的学习效果更好。实验证明,通过对局部范围内的机器人都采用此算法,可以让球员间在局部范围内的协作能力有明显的加强,从而使球队的整体攻防能力有所加强,但是受到计算机硬件、软件和计算能力的限制,无法对全局agent都采用此算法,否则无法保证比赛的实时性。在此理论基础上实现的安徽大学DreamWing2D队伍在RoboCup中国公开赛仿真2D组中获得的成绩证明了此算法的可行性。
其他文献
随着军事通信技术的日新月异,现代战争战场通信系统日益复杂,伴随我军通信系统的快速发展,建设高效、畅通、合成的战场通信网络是我军通信发展的客观需要。战场军事通信网仿真研
Web服务是一种面向服务架构的技术,通过标准的Web服务协议提供服务,保证不同平台的应用服务可以相互操作。Web服务作为一种新型的分布式构件模型已经在电子商务、企业应用集成
随着智能视频监控系统的高速发展,近年来,人们对视频监控系统的智能性要求日益提高。多摄像机网络能够监控更广阔的区域,正在逐渐被重视。但是,从经济、资源等方面的考虑,不太可能
近年来,随着无线移动通信技术的迅猛发展,第三代移动通信系统已经得到应用,第四代移动通信系统逐渐成为学术界和工业界关注的热点。第四代移动通信系统是一个多种通信系统的综合
我国于2013年初确定了第一批智慧城市试点名单,这也预示着我国城市的发展和规划开始由原来的数字化城市向更高的形态转变,即智慧城市。智慧城市是利用信息和通信技术使城市更
长期以来,对断路器热脱扣测试一直停滞在手工测量的阶段。其每项性能参数根据试验的基本原理,用传统仪器或专用测试仪器来测量。这种试验方法从结构来看,一般为分立的专用仪器;从使用方式来看,以手工操作、人工读数为主,人工计算为辅;从数据管理的角度来看,无法同时处理大量的数据,没有数据库保存测试的各项参数,无法对以前的测试数据进行比较、汇总等工作;从查找故障的角度看,无法快速准确地找到故障原因和位置;从安全
随着网络和信息化建设的不断发展,局域网设备的数量越来越多,如何保证这些设备的正确运行,出现故障如何第一时间得到通知,准确定位问题所在,并迅速解决问题,这些方面都需要着重考虑
随着多媒体数字化技术的发展和推广、存储成本的降低、网络传输带宽的增长,各种多媒体数据如图像、视频等飞速膨胀逐渐成为信息的主流,并对人们的生活和社会发展产生重要的影响
中国已成为全球最大的汽车市场,由此产生的诸如交通阻塞、交通事故等社会问题正日趋严重。车联网是解决交通问题的有效途径,中国车联网将形成巨大的新兴产业。然而,车联网中驾乘
多相流作为自然界普遍存在的一种现象,不仅是由于被测介质的介电常数会随着温度等环境的变化而变化,而且还由于被测场域中存在其他介质,会使得测量时出现介质未知的情况,并且