仿真机器人足球中球员合作策略研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：sakurabb1

【摘要】

：

构造可以通过决策产生智能行为的智能体可以看作是人工智能现阶段的主要目标之一。各类决策算法使得智能体能够在多个方面近似做出人类可以做出的智能行为。在不确定性环境中

【作者】

：

陈荣亚

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2015年期

【关键词】

：

机器人世界杯多智能体决策马尔科夫决策过程仿真2D MAXQ分层分解技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

构造可以通过决策产生智能行为的智能体可以看作是人工智能现阶段的主要目标之一。各类决策算法使得智能体能够在多个方面近似做出人类可以做出的智能行为。在不确定性环境中,马尔科夫决策过程为智能体决策提供了基本的模型。RoboCup机器人世界杯成立的初衷是为了促进人工智能、机器人等领域的研究和技术的发展。最早成立的RoboCup仿真2D组是其中以智能体决策为重点内容的一个项目。本文以RoboCup仿真2D机器人足球为实验平台,以马尔科夫决策过程相关理论为基础,来描述和处理大规模不确定性环境下的多智能体协作规划问题。本文涉及到的主要工作可以概括为以下三个部分：·本文实现了用于仿真2D比赛场景重现的Trainer和rcsslogplayer的改进,使得针对某个特定场景进行反复训练测试成为可能。由以前单纯使用比赛胜率的方式,改为从特定场景开始反复进行随机测试,其得到的结果更能证明某个方法的效果。·本文引入了MDP的分层分解技术,将其与WrightEagle中的反算技术相结合,并在守门员的决策中应用。通过改进守门员的站位决策,影响对方的传球行为,降低了对方突破我方防线、形成单刀球的威胁。·本文提出了解决多智能体协作问题的MAXQ-MOP方法。MAXQ-MOP以MAXQ-OP算法为基本框架,引入了信念池的概念,使其应用到多个智能体的协作规划问题中。在人墙站位问题和多球员传接球协作的实验中,MAQX-MOP表现出比传统方法更好的效果。本文中所有的工作都是在WrightEagle队上改进实现的。

其他文献

基于HLA的动态森林生长仿真原型系统研究与设计

虚拟森林生长仿真从生态系统的角度出发,采用虚拟现实技术对森林生长的动态变化过程进行模拟,模拟结果可对林业生产的管理起到指导作用。传统的森林仿真系统往往侧重于场景的

学位

动态森林生长模块化层次化高级体系结构开放式网格服务体系结构分布式结构

网上虚拟电工电子实验运行系统的开发与研究

在传统的电工电子学的实验教学中，很多学校都存在着资源不足、投资大、见效低、实验环境及过程具有一定的危险性等问题。随着多媒体技术和网络技术的迅速发展，通过网络和虚拟的

学位

电工电子实验JavaSpice虚拟实验ESpice

GPU上图处理并行框架的设计与实现

图是一种强大的数据结构，它可以表达现实世界中事物之间错综复杂的关系，如城市之间道路的连接关系，网页之间的引用关系，人与人之间的社交关系。近年来GPU体系结构的蓬勃发展让人

学位

GPU图处理并行框架图应用程序拓扑结构BFS算法

基于备份的移动自组织网络分簇策略研究

移动自组织网络(Mobile Ad Hoc Network, MANET)是一种无需基础设施支持的新型无线网络,具有组网灵活,易于移动与部署,抗毁能力强等特点,在军事行动、灾害救援、临时会议等场

学位

移动自组织网络分簇模拟仿真工具BH-3hBAC簇头备份机制

基于Struts框架和Hibernate的Web应用系统的研究

传统的Web体系结构在代码的移植、程序的可扩展性方面产生了众多问题;另一方面,JDBC作为持久层解决方案存在着很大的局限性,而EJB必须遵循各种J2EE规范,这增加了其开发的复杂

学位

Struts框架MVC模式ORMHibernate

基于MPI的集群计算系统设计与实现

科学技术的发展极大地促进了计算科学的进步。新一代计算机无论是计算能力还是计算速度都比以前的计算机优越，但是人类对计算的要求也在不断地提高。在实践中，有些单处理器不能

学位

Linux集群并行计算单系统映像集群中间件

MPEG压缩域运动对象提取算法研究

视频对象(Video Object, VO)的提取是视频信号处理领域研究的热点，在基于对象的视频编码、智能视频监控系统、人脸检测、目标识别、视频数据库检索等领域有着广泛的应用。由于

学位

视频对象视频信号处理视频编码对象提取压缩域提取提取算法

聚类中的特征学习研究

人类要认识世界就必须区分不同的事物并认识事物间的相似性，聚类是按照事物间的相似进行的一种无监督分类，是在对数据不作任何假设的条件下进行分析的一种工具，聚类已广泛应用于

学位

聚类算法特征评价函数Relief算法特征学习聚类

基于USB总线的高速数据采集系统设计

通用串行总线USB(Universal Serial Bus)是一种新型的微机总线接口规范。随着客户对系统数据采集速度要求的不断提高,USB以其使用方便、易于扩展、速度快等优点而越来越多的

学位

USB总线单片机数据采集固件Windows驱动程序模型设备驱动程序客户应用程序

基于RFID技术的产品防伪应用系统的设计与实现

当前在市场上假冒伪劣商品猖獗，打击假冒伪劣商品，保护消费者权益是倍受重视的问题。许多产品防伪技术应运而生，但大多数传统的防伪技术效果不够理想，消费者面对各种真假产品无法

学位

企业产品防伪技术电子标签射频识别

仿真机器人足球中球员合作策略研究

与本文相关的学术论文