基于Q学习的Agent智能防守策略研究与应用

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:maigcy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模拟机器人足球比赛(Robot World Cup,RoboCup)作为多Agent系统的一个通用的实验平台,通过它可以来评价各种理论、算法和框架等,已经成为人工智能的研究热点。针对RoboCup仿真中的守门员防守问题,基于Q学习算法,描述了在特定场景中应用Q学习训练守门员的方法和过程。在RobCup中验证了该算法,实现了守门员防守策略的优化。
其他文献
提出了一种全新的统一计算方法,该方法建立了高速微粒轰击毛化工艺与结晶辊表面最终形貌参数之间的数学模型,即将整个毛化工艺制备过程划分为三个阶段:第一阶段是应用计算流体
针对燃气轮机P2压力高进行分析,通过试验确定机组点火前P1压力对P2的影响,减少了运行人员操作,并提出了一些建议。
为提高煤仓上口原煤运输效率,减小定期更换刮板机刮板链、刮板、箱体耐磨板、链轮轴组等工作量,降低材料消耗,避免因瞬时煤量增大造成刮板机出现断链对生产的影响,梅花井煤矿
5月29日,《港口國措施协定》第一次缔约方会议在奥斯陆举行,为期一周的活动中,与会代表将探讨成功落实该协定的办法,预计将对相关国家及区域渔业管理组织和其他国际机构的责任进行界定。  2016年6月生效的《关于港口国预防、制止和消除非法、不报告、不管制捕鱼的措施协定》(《港口国措施协定》)现有46个缔约方,包括代表28个成员国的欧盟,目前占全球鱼品贸易的三分之二以上。  由粮农组织协调的《港口国措施
某电厂1号高压联合主汽阀解体检修后,首次带负荷运行无法正常开启,冷态传动开关正常。本文针对270T533型高压联合主汽阀开启故障原因进行分析,制定科学合理的处理措施,消除设
长期以来,在公安学这一研究领域里,对应用性、对策性的公安专业业务的研究比较突出.但是,对公安学基础理论问题的研究目前仍然十分薄弱.因此,有必要就公安学的历史发展、学科
<正> 现代篮球比赛中不仅要比运动员的身体条件、身体素质,比技、战术水平,比运动员的心理状态,而且还要比运动员的意识思维能力。美国一位篮球专家认为&#39;现代篮球比赛的
据国际电联网站4月10日报道, 第7届国际电联绿色标准周(GSW-17)通过了《马尼萨莱斯宣言》,表達了850多名活动参与者发展资源高效型循环经济与可持续智慧城市的共同承诺。  4月3-5日,GSW-17在哥伦比亚马尼萨莱斯举办,由哥伦比亚信息和通信技术部及马尼萨莱斯市政府承办。活动探讨了现代城市治理面临的挑战和市民的福祉问题,以及在实现联合国《新城市议程》和《可持续发展议程》过程中信息和通信技术
现代体育文化的价值在于谋求身体的培育和发展,增进健康和保持积极的心理、生理状态。其体育行为主要是群体性的竞技活动和个体的保健活动以及各种类型的娱乐活动,其目的在于实