基于神经网络的阵型策略在线学习研究及应用

来源 :安徽工业大学 | 被引量 : 0次 | 上传用户:tsmcxuesheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RoboCup仿真2D比赛过程需要球队间的整体高效的合作及多个智能体之间默契配合,如阵型策略的调节,才能赢得比赛胜利。但由于通讯的限制,智能体很难在动态实时的比赛环境中得到足够多的队友合作信息。若是可以获得更多的对手信息,智能体就能做出相对正确的决策,最终达到射门得分的目标。因此研究学习不可预测的对手信息,如球员异构,阵型策略跑位等是迫切需要的。目前,如何提高智能体的学习能力、对手建模能力以及多智能体的合作能力已成为RoboCup领域的研究热点。近年来随着计算机技术、分布式人工智能技术和多智能体系统的快速发展,RoboCup仿真2D的竞赛水平也有了较大的提高。论文首先讨论了阵型策略的发展过程及其研究意义。随后系统的描述了RoboCup的系统结构及工作原理,并就国内外几支知名球队探讨了RoboCup仿真2D的研究现状和发展趋势。在分析agent2d阵型策略的设计思想及实现过程的基础上,提出了利用Delaunay三角剖分的方法分析阵型中的战术策略。研究了在线教练的工作流程及利用其规则在线完成对手建模等问题。在充分研究神经网络的基础上提出了基于神经网络,利用在线教练为对手的阵型跑位点建立网络模型,详细介绍了此方法的思想,分析了方法的预测准确性、时间复杂度以及相关参数的影响。利用在比赛中收集真实数据的实验表明该方法具有较高的预测准确度。
其他文献
粗糙集理论是一个有效的数据挖掘方法,正越来越被人们所重视。其主要思想是保持分类能力不变的情况下,利用等价类,通过约简,达到发掘知识并简化知识的目的。 首先,本文介绍了数
随着工业自动化水平的提高,传统的自动控制理论已经发展成熟,基于状态空间法的现代控制理论得到了成功的应用,但对于难以建立精确数学模型的被控对象,应用这两种控制方法效果就不
传统计算语言学的种种理论和方法,都以语料统计为基础。但是,只靠统计概率是不能统摄复杂多变的语言现象的,因此还需要结合语言规则,进行句法和语义的分析。 依存语法是上个世
近年来web2.0社交网站和电子商务网站突飞猛进的发展,正深刻地改变着普通大众的生活方式,在web2.0网站上用户可以自由地发布信息,使得互联网上的信息规模正以指数式增加,而且人们
传统的传统方法认为过程是解决软件问题的核心,重视过程、重视文档是这些方法的特征。本文从传统的传统开发方法(以瀑布模型为代表)开始,简单分析了瀑布模型、演进模型、反复模
目前随着电子商务的发展经历了以IT厂商和媒体为主的第一阶段和以电子商务服务商为主体的第二阶段后,现在正在进入以传统企业为主体的第三阶段,这个阶段就是协同电子商务阶段
软件产业是发展速度最快的产业之一。然而统计表明,在其短短的发展历史中,却充满了项目失败的例子。为了更好地对软件开发成本和开发进度进行有效的控制,必须有合理而准确的软件
嵌入式系统是一种具有特定功能的专用计算机系统。嵌入式系统作为实现设备小型化、智能化和自主知识创新的一个重要元素,目前已广泛运用于国防、工业、交通、能源、信息以及日
随着计算机技术以及多媒体网络通讯技术的兴起和快速发展,数字视频编码技术在人们日常生活中起到的作用也越来越重要。由JVT制定的新一代视频编码标准——H.264/AVC能够提供更
本文分析比较了IPv4和IPv6两种协议的异同点,介绍了IPv6新协议的特点及一些技术规范。并着重研究从IPv4向IPv6过渡的问题。重点分析了目前几种比较成熟的技术:双协议栈技术、隧