强化学习与决策树方法在RoboCup中的研究与应用

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：nsldp

【摘要】

：

本文首先介绍了多智能体系统，并回顾了机器人足球世界杯赛事，然后研究了机器人足球仿真比赛中多智能体系统的构建，即设计并实现了一支机器人足球仿真比赛队伍BJUT。本文的主要研

【作者】

：

张家旺

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2006年期

【关键词】

：

智能机器人多智能体系机器人学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

本文首先介绍了多智能体系统，并回顾了机器人足球世界杯赛事，然后研究了机器人足球仿真比赛中多智能体系统的构建，即设计并实现了一支机器人足球仿真比赛队伍BJUT。本文的主要研究工作包括： 1、应用了经典的智能体体系结构，将智能体架构分为建模模块、通讯模块、信息解释及分析模块、决策模块等，从而分解了整个智能体的设计难度； 2、给出了在实时、有噪声、对抗性和时间紧迫的多智能体系统下的BJUT仿真球队的体系结构； 3、详细介绍了决策树算法，并将C5.0算法应用于解决传球问题。Agent利用该算法产生决策树进行传球决策，同时通过执行其他动作来调整可控因素，从而进一步提到了传球的成功率； 4、将Q-Learning算法应用于RoboCup带球。该方法改变了传统算法中的动作选择集，使用角度和力量的选择代替了动作选择，实验证明了其有效性； 5、将基于ASPL(ActionSelectionPriorityLevel)模型的多智能体强化学习方法用于解决RoboCup中多智能体协作问题。将上述的体系结构和Q-Learning算法相结合，应用多智能体学习方法对Agents进行训练，从而有效地提高了整个球队的协作能力。

其他文献

基于3S技术的农田地块监测更新系统的研究

自二十世纪80年代以3S为支撑的“精准农业”技术应用于生产管理以来，农业生产数字化和可控化便进入了一个崭新的阶段。为了向“精准农业”的生产者和管理者提供高现势性的地块

学位

精准农业农田地块监测更新全球定位系统地理信息系统遥感技术短消息服务

基于视频监控的城市交通异常事件检测算法研究

基于监控视频处理的交通异常事件检测技术已成为智能交通系统的重要技术之一。与传统的地埋线圈检测器技术进行交通事件检测相比，具有较高的实时性与直观性。但是，基于监控视频

学位

异常事件检测监控视频城市交通IPM视角变换混合模式匹配

舰船航迹仿真与检测

本文对舰船航迹仿真与检测进行了研究。文章使用不同的方法讨论了航迹频谱与航速之间的关系问题，并在Matlab上验证了理论分析的结果。湍流航迹的形状理论上可由舰船长宽比和舰

学位

航运管理湍流航迹航迹仿真

基于回路成形的控制器设计

本论文的主要内容之一是提出选择加权函数的新方法来设计H∞回路成形鲁棒控制器,之二是对回路成形方法与结构化奇异值μ结合设计的μ回路成形控制器和H∞回路成形控制器二者的加权函数之间的关系给出分析。在本文中,首先针对非结构不确定性扰动,介绍了SISO回路成形的设计概念,它利用小增益理论来达到系统鲁棒稳定,并推导出开回路函数L(GK)与系统的鲁棒性能和鲁棒稳定之间的关系,从这些概念又延伸到H∞回路成形法。

学位

H_∞鲁棒控制结构化奇异值μ回路成形法H_∞回路成形控制器μ回路成形控制器加权函数的选择不确定性互质分解

工程投标报价决策支持系统研究

随着市场竞争将愈演愈烈。对此,工程公司能否抓住有利时机,正确掌握工程投标报价技术与决策技巧,以经营战略的高度做出是否投标、是否争取承包该项目的决策,进而在工程投标竞

学位

投标系统案例推理清单计价

嵌入式服务器在PLC设备监控中的应用研究

随着嵌入式系统的发展和Internet的普及,越来越多的嵌入式系统将网络引入其中。这样嵌入式系统能接入Internet从而具有网络服务器功能,用户可以在任何时间、任何地点,对系统

学位

嵌入式服务器PLC网络串口通信

蓝牙协议分析及其在蓝牙耳机中的应用

蓝牙(Bluetooth)是一种无线数据及语音通信的开放性全球技术，它以低成本的近距离无线连接为基础，为固定与移动设备通信环境建立一个特别连接。随着技术的发展和完善，具有非常广

学位

蓝牙蓝牙协议栈蓝牙模块蓝牙耳机无线数据语音通信

基于Modbus协议的工业控制网络技术的研究与实现

随着控制技术的进步，工业控制系统已经呈现了网络化的发展趋势。伴随着现场总线技术和以太网技术的发展，工业以太网应运而生，成为了一种新型控制技术。工业以太网的出现，将为实现

学位

现场总线工业以太网Modbus协议串口通信系统集成

基于嵌入式Linux平台的车载导航系统的研究与设计

车载导航定位系统在过去十年内已经成为汽车工业发展的焦点。在欧美国家和日本，车载导航系统在最近几年内得以广泛的应用，而随着国内汽车工业发展，国内的车载导航系统的市场需求

学位

车载导航系统系统设计卡尔曼滤波套接字

嵌入式图形组态软件的研究与开发

随着计算机软、硬件技术的发展,嵌入式系统在工业控制中的应用越来越广。但在工业控制领域中已取得巨大成功的组态软件却很少能够直接运行在嵌入式平台上。而现今工业控制领

学位

嵌入式系统组态软件网络通信ARM

强化学习与决策树方法在RoboCup中的研究与应用

与本文相关的学术论文