【摘 要】
:
本文首先介绍了多智能体系统,并回顾了机器人足球世界杯赛事,然后研究了机器人足球仿真比赛中多智能体系统的构建,即设计并实现了一支机器人足球仿真比赛队伍BJUT。本文的主要研
论文部分内容阅读
本文首先介绍了多智能体系统,并回顾了机器人足球世界杯赛事,然后研究了机器人足球仿真比赛中多智能体系统的构建,即设计并实现了一支机器人足球仿真比赛队伍BJUT。本文的主要研究工作包括:
1、应用了经典的智能体体系结构,将智能体架构分为建模模块、通讯模块、信息解释及分析模块、决策模块等,从而分解了整个智能体的设计难度;
2、给出了在实时、有噪声、对抗性和时间紧迫的多智能体系统下的BJUT仿真球队的体系结构;
3、详细介绍了决策树算法,并将C5.0算法应用于解决传球问题。Agent利用该算法产生决策树进行传球决策,同时通过执行其他动作来调整可控因素,从而进一步提到了传球的成功率;
4、将Q-Learning算法应用于RoboCup带球。该方法改变了传统算法中的动作选择集,使用角度和力量的选择代替了动作选择,实验证明了其有效性;
5、将基于ASPL(ActionSelectionPriorityLevel)模型的多智能体强化学习方法用于解决RoboCup中多智能体协作问题。将上述的体系结构和Q-Learning算法相结合,应用多智能体学习方法对Agents进行训练,从而有效地提高了整个球队的协作能力。
其他文献
自二十世纪80年代以3S为支撑的“精准农业”技术应用于生产管理以来,农业生产数字化和可控化便进入了一个崭新的阶段。为了向“精准农业”的生产者和管理者提供高现势性的地块
基于监控视频处理的交通异常事件检测技术已成为智能交通系统的重要技术之一。与传统的地埋线圈检测器技术进行交通事件检测相比,具有较高的实时性与直观性。但是,基于监控视频
本文对舰船航迹仿真与检测进行了研究。文章使用不同的方法讨论了航迹频谱与航速之间的关系问题,并在Matlab上验证了理论分析的结果。湍流航迹的形状理论上可由舰船长宽比和舰
本论文的主要内容之一是提出选择加权函数的新方法来设计H∞回路成形鲁棒控制器,之二是对回路成形方法与结构化奇异值μ结合设计的μ回路成形控制器和H∞回路成形控制器二者的加权函数之间的关系给出分析。在本文中,首先针对非结构不确定性扰动,介绍了SISO回路成形的设计概念,它利用小增益理论来达到系统鲁棒稳定,并推导出开回路函数L(GK)与系统的鲁棒性能和鲁棒稳定之间的关系,从这些概念又延伸到H∞回路成形法。
随着市场竞争将愈演愈烈。对此,工程公司能否抓住有利时机,正确掌握工程投标报价技术与决策技巧,以经营战略的高度做出是否投标、是否争取承包该项目的决策,进而在工程投标竞
随着嵌入式系统的发展和Internet的普及,越来越多的嵌入式系统将网络引入其中。这样嵌入式系统能接入Internet从而具有网络服务器功能,用户可以在任何时间、任何地点,对系统
蓝牙(Bluetooth)是一种无线数据及语音通信的开放性全球技术,它以低成本的近距离无线连接为基础,为固定与移动设备通信环境建立一个特别连接。随着技术的发展和完善,具有非常广
随着控制技术的进步,工业控制系统已经呈现了网络化的发展趋势。伴随着现场总线技术和以太网技术的发展,工业以太网应运而生,成为了一种新型控制技术。工业以太网的出现,将为实现
车载导航定位系统在过去十年内已经成为汽车工业发展的焦点。在欧美国家和日本,车载导航系统在最近几年内得以广泛的应用,而随着国内汽车工业发展,国内的车载导航系统的市场需求
随着计算机软、硬件技术的发展,嵌入式系统在工业控制中的应用越来越广。但在工业控制领域中已取得巨大成功的组态软件却很少能够直接运行在嵌入式平台上。而现今工业控制领