基于RoboCup多智能体系统学习与协作问题的研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:jiang663613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展,分布式人工智能中多智能体系统(MAS:Multi-agent System)的理论及应用研究已经成为人工智能研究的热点。RoboCup(Robot World Cup)即机器人世界杯足球锦标赛,是一种典型的多智能体系统。该系统具有动态环境、多个智能体之间合作与竞争并存、受限的通讯带宽以及系统设置的随机噪声等特点。通过该系统这个具有普遍意义的试验平台,可以深入研究和评价多智能体系统中的各种理论和算法,并将结果推广到众多领域。本文的主要研究工作如下:1)针对RoboCup中Agent决策任务的复杂性特点,设计了基于分层学习的决策框架。该决策框架将Agent的决策任务按高级到低级分为多个层次,每层的决策通过相应机器学习方法实现,并以下一层的学习结果为基础。而针对层结构的误差积累问题,采取了一种改进的层结构,加入了一个协调层,用于对决策信息进行评价,并对明显错误的信息进行更正。2)为了提高Agent个体技术的智能性,采用遗传神经网络技术进行离线训练,实现了Agent的截球技术。实验表明,该技术较好地解决了噪声所造成的干挠影响。而对于智能体的踢球技术,则采用Q学习进行离线训练。3)针对Agent团队协作的进攻决策学习问题,对单Agent的Q学习算法进行了扩展。主要思想是引入学习智能体,同时,将统计学习与增强学习相结合,通过对智能体间联合动作的统计来学习其它智能体的行为决策。本文的相关实验在Robocup仿真比赛环境下进行,实验结果证明采用本文的学习算法有效地实现了Agent在复杂环境下的智能决策。
其他文献
含执行器饱和特性的不确定非线性系统普遍存在于实际工程领域,系统的动态性能以及稳定性与执行器饱和特性有着很大的关系,因此研究执行器饱和限幅下的控制算法具有重要的理论
本文以冶金、化工等行业中常见的电加热炉温度控制系统为控制对象,分析了其控制特性,论述了电加热炉温度控制系统的设计方案。针对温度控制中存在的一些问题,如难以确定精确
在湿法冶金的铜萃取过程中,反萃余液中铜离子浓度的变化直接反映萃取过程的实际萃取效果。在实际生产过程中,对铜离子浓度的判断主要依赖人工经验的方法,即操作工人通过观察
永磁式磁轴承利用了永磁铁产生的磁场力来承载转子,一般由永磁轴承和电磁轴承组成,具有转速高、寿命长、无需润滑、功耗低等特点。针对磁轴承在太空应用中的低功耗要求,本文研究
现代旋转机械正朝着高速化、重载化、智能化的方向发展,透平、风机、压缩机等高速旋转设备已经成为过程工业中的核心装置。然而,由于质量不平衡而引起的同频振动影响了设备的
学生课堂行为视频观察记录系统以视频数据为基础,应用计算机视觉、模式识别等技术对学生的课堂行为进行分析,分析结果记录作为学生课堂表现评价的参考依据。基于视频的行为观
本文结合多示例学习算法,研究并实现了基于图像内容的色情图像监控系统,从理论和实践上对多示例学习算法在图像过滤领域的应用进行了一个探索。特征提取是机器获取图像内容的
无人机编队是指多架无人机形成特定的队形,并协同完成特定的任务。编队技术在军事及民用领域都具有广泛的应用,比如侦察、打击、勘测、组网、空中加油等。经过几十年的发展,
随着控制技术的研究与发展,倒立摆的精确控制策略在工业生产的复杂对象的控制中发挥着越来越重要作用。倒立摆具有多变量、高阶次、强耦合等特性,被广泛地应用于算法验证的实
针对网络控制系统的特点和现状,本文设计了基于EtherNet/IP的网络控制系统,将目前最流行的工业以太网EtherNet/IP应用于过程控制中进行流量控制,并将具有单神经元PID控制器应