基于分层强化学习的MAUVS围捕策略研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:jiward
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自主水下机器人(Autonomous Underwater Vehicle,AUV)可用来完成水下复杂而繁重的任务,是未来海洋勘测以及水下能源开发重要的工具。随着计算机技术和通信技术的成长,多自主水下机器人系统MAUVS(Multiple Autonomous Underwater Vehicles System)得到越来越多的关注。与AUV相比,MAUVS具有灵活性,高效性及容错性强等特点。多智能体协同围捕经常作为检测机器人学习性能的测试平台,故MAUVS围捕是现阶段研究的热点。本文为了提高MAUVS围捕效率,设计了一种新的围捕方法,具体工作内容包括如下:首先,详细介绍了本课题的研究背景及意义,结合多机器人围捕现状的研究,对围捕任务完成过程中尚存的问题以及现有围捕策略的局限性进行了分析。其次,为了克服目标AUV的反智能围捕性,设计了一种面向动态围捕的MAUVS任务分配方案,进而提出了一种基于角色及能量约束的任务分配方法,并且阐述了面对动态围捕任务时此方法提出的必要性。再次,利用分层强化学习中较为灵活MAXQ算法对具体围捕策略进行设计。针对MAXQ自身不能自主分层的缺陷,提出了一种利用SOM自主特征映射神经网络来修改MAXQ抽象机制的方法,即S-MAXQ自主分层策略。该方法使用了SOM自组织特征映射神经网络的特性,使子任务能够自主被Agent发现并进行自组织并行学习,从而更加适应动态环境下的学习任务,并且利用V-REP仿真软件搭建具有障碍物场景模拟真实环境进行算法的分层效果仿真,结合matlab进行算法的性能分析。递次,为了适应复杂海洋环境,采用半马尔科夫对策论的方法实现MAUVS的分层强化学习,并且在上述S-MAXQ能够将围捕任务自主分层的基础上增加了MAUVS的行为预测功能,提出了一种SP-MAXQ算法,并建立了状态-动作表,使得学习经验能够得到更好的复用,这样增强了MAUVS在复杂环境下适应环境和相互合作的能力,并且利用V-REP仿真软件搭建具有障碍物场景模拟真实环境进行围捕仿真,结合matlab进行算法的性能分析。最后,利用Pioneer3-DX机器人做出实体仿真效果,进一步说明本文提出算法的有效性。
其他文献
半导体光催化技术因为有望解决现代经济快速发展所带来的能源短缺和环境污染问题,而得到国内外科学家的广泛关注。作为最具代表性的紫外光和可见光催化材料,TiO2和BiVO4因为
全光通讯的飞速发展推动了长距离光纤网络的大规模构建,如何降低光通信过程中光信号损失的同时,提高器件的集成性始终是光通信领域的研究热点。一直以来,磷酸盐玻璃因为具有
四氢吡咯烷是一类重要的化合物,这一结构单元广泛存在于天然产物、医药、食品以及农药中,其衍生物具有广泛的生物活性。此外,四氢吡咯烷衍生物在不对称合成中作为催化剂被广
在大力推行生态化长寿命路面建设之际,玄武岩纤维作为一种绿色环保的高性能矿物纤维,组成成分与集料区别甚微,只是存在形式不同,其与沥青材料结合具有优越的可行性。沥青胶浆粘弹特性是决定沥青路面性能的关键因素之一,研究玄武岩纤维沥青胶浆及其混合料路用性能具有重要意义。论文对比研究了四种纤维基本性能,分析了玄武岩纤维的优越性。通过正交试验测试了玄武岩纤维沥青胶浆高低温性能指标,评价了粉胶比、纤维掺量、纤维长
镍基合金主要是在一定温度下(650℃1000℃),表现出较好综合性能的一类合金,不同种类微量元素添加到镍基合金镀层中,对于镍基合金镀层的性能会产生不同的影响。过去使用传统方法
本文主要研究藏族印章的发展及其演变过程,共分四章。研究对象产生的时间界定为吐蕃赞普松赞干布时期至新中国成立之前。笔者通过阅读敦煌藏文文献、国内外研究成果,以及考查
在铋基材料家族中,富氧态碘氧铋Bi4O5I2纳米材料以及硅酸铋纳米材料作为一种新型的环境友好型光催化剂,具有独特的能带结构以及特殊的层状结构,能够有效的产生/分离光生电子-
目前,米渣因蛋白质含量高,且具有大米蛋白氨基酸组成平衡合理、口感温和、低过敏性等优点,在工业上应用越来越受到人们关注。由于米渣中含有较高含量的残余脂肪,严重影响米渣
压缩感知技术(Compressive Sensing,CS)是近年来信号处理领域最为热门的技术之一,它被用于处理自身具有稀疏特性或在某一特定的变换域内具有稀疏特性的信号,使其可以在低于信
评价指标体系的建立是制定政策、编制规范和指导规划的基础工作。该研究是对汉中民居宜居性建设的前期研究工作,探讨了有关地方性评价体系的基本特征,研究成果对于实际情况中解决多意见共同决策的问题具有参考价值。首先,本文对《住宅性能评定技术标准》、《健康住宅评价标准》、《绿色建筑评价标准》等现行居住建筑评价指标体系进行分析,根据人居环境科学理论从自然环境、人工环境、文化环境和经济条件等方面比较现行标准与民居