RoboCup仿真2D中的Agent智能决策系统

来源 :安徽大学 | 被引量 : 7次 | 上传用户:schunter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近几十年,随着计算机技术的迅猛发展,对于分布式多智能体系统(MAS: Multi-agent System)的研究和应用已经成为以人工智能为主的众多相关学科的研究重点。RoboCup即机器人足球世界杯,通常被认为是研究多智能体系统的一项非常有影响力的人工智能方面的重大赛事。RoboCup分为两个大类的项目,分别是仿真和实体机器人。本论文主要是基于仿真项目的比赛赛事,对RoboCup仿真2D比赛当中单个智能体在场上的对于种种因素的各种决策以及多个智能体在对抗的实时环境之中的团队配合决策做了一个重点的研究。在RoboCup仿真比赛之中,智能体的决策大致可以分为高层决策和低层决策。高层决策主要是为了多智能体之间的团队配合服务的,分为战略层决策和战术层决策。高层决策是面向多智能体系统的,具体到单个智能体之上就表现为它的行为决策,在RoboCup之中也叫动作决策。智能体的动作决策就是指智能体(Agent)根据当前场上各种环境状态(包括实际感知和预测),以及赛前己方球队已经制定的合作协议,来决定当前环境下应该发送给服务器的动作指令,同时更新自身的状态。低层决策一般是指智能体高级动作的行为分析之中对于某些因素的决策,例如传球动作当中的对于接球队员的选择决策,射门动作当中的对于射门点选择的决策等。对于RoboCup之中Agent的决策系统,可以将机器学习的方法引入这个优秀的实验平台,帮助Agent在实时比赛的时候无论对于防守还是进攻都能做出更加合理有效的决策。在实际的RoboCup仿真2D球队的开发当中,各支球队的设计和开发人员对于机器学习的引进都不尽相同,但是大部分是以决策树学习,人工神经网络学习和强化学习为主。本论文将机器学习引入到智能体高级动作的学习之中,使智能体高级动作的执行效果进一步优化,成功率进一步提高,从而能够很好的服务于智能体的高层决策。通过将决策树学习算法应用到智能体的传球训练之中,使得智能体的传球更加精准;以及将人工神经网络应用到智能体的射门动作训练中,使得智能体射门的成功率大大提高。最后本论文还将Q学习应用到RoboCup仿真2D比赛的智能体前场进攻动作决策之中,通过引入区域划分,基于区域划分的奖惩函数和对现实生活中真人足球赛中动作决策的模拟,在经过大量周期的学习训练后,使智能体能够进行自主动作决策,从而加强多智能体的前场进攻实力,进而提高整个球队的进攻能力。
其他文献
计算机网络协议的研究热点之一是如何更有效地传输数据,包括数据传输的高效性、可靠性、公平性等等,实际应用中最为广泛的协议是TCP/IP协议。其中,UDP协议是它的一个重要研究
随着经济快速增长以及社会不断变化,现实世界中的优化问题也变得越来越复杂多变,影响因素和目标都渐渐趋向于多样化,多目标进化算法应运而生。要达到多个目标的同时优化,并不
在21世纪的今天,跟着全球化日益加强的脚步,国家与国家之间的交流也越来越频繁,自然语言之间互译的需要也越来越迫切,在人力资源有限的情况下,机器翻译的出现使人们看到了曙
随着Internet的普及和发展,软件的运行环境从静态、封闭、可控转向动态、开放、难控。在网络环境下实现资源集成和共享成为计算机软件技术面临的重要挑战之一。网构软件的提出
随着计算机和信息技术的发展,人们可以无节制地从互联网上获取资源并存放到个人电脑硬盘上。这些日益积累而成的大量资源文件,具有格式多样和存放位置不一等特点,从而导致我
近年来,关键行业的关键任务对工业自动化日益强烈和多样化的需求促进了工业控制计算机(简称工控机)的快速发展。作为微处理器主要供应商的ARM公司为了适应这一发展需求,针对工控
推荐系统是应用在电子商务系统中的一门非常成功的技术,它能有效缓解由于互联网飞速发展所带来的信息超载问题,并根据人们的行为、偏好等特点从海量数据中挖掘用户的潜在需求
现如今,网络通信的快速发展和电子商务活动的蓬勃兴起,各种网络设施也与之进步。数据库,作为信息的存储系统,是IT设施的基石之一,为用户提供了数据存储和共享服务。为了获得
安全多方计算(Secure Multi-party Computation, SMC)是研究多方协作计算问题的,即互不信任的两个或多个用户能够进行协作计算某项计算任务,并且保证自己的私有输入是安全的
与传统的静态数据相比,现代数据多以数据流的形式产生和积累,数据类型方面也越来越常见到多标签类型。数据形式与类型的变化无论对单标签数据流分类还是多标签数据流分类都提