基于强化学习的水下航行器三维航迹自动保持方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:dwj854
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人水下航行器(Unmanned underwater vehicle,UUV)在水下执行任务过程中,由于风、浪、海流等因素的影响,同时也因为自身操纵和执行系统本身的误差,其航行轨迹不可能完全和预定航线吻合。因此在航行过程中,应该持续对UUV进行检测,并在其严重偏离预定航向的时候,自动控制,令其重新回到预定航线上。本文针对UUV在未知环境下的三维航迹保持问题开展研究,主要进行了如下几方面的研究工作:首先,介绍UUV和UUV航迹保持技术的国内外研究现状,并对UUV的运动模型进行研究。在建立适用于UUV运动的固定坐标系和运动坐标系基础上,得出UUV的运动学方程,并对UUV所受的几种作用力进行分析,从而得出UUV的六自由度动力学方程。在不影响UUV运动学特征的前提下,根据论文研究需求将UUV的六自由度模型简化为四自由度模型,并选用三种典型运动对UUV模型进行仿真研究,通过分析位置距离、艏向角、速度等信息验证UUV模型的准确性。其次,对UUV航迹保持算法进行研究。在UUV航迹保持领域的研究中,对控制系统的设计大多采用滑膜控制、反步控制、固定参数的PID控制等传统控制方法,为更好的应对复杂多变的环境以及其他干扰的影响,将强化学习中的Q学习算法与BP神经网络进行融合,通过分析UUV在航迹保持过程中存在的强化学习问题,设计出改进的BP神经网络-Q学习算法,利用BP神经网络良好的逼近特性对Q函数进行逼近,使之能够对连续状态的UUV进行学习优化。再次,对UUV航迹保持控制系统进行设计。控制系统由四个控制器组成,并分别对北向位置、东向位置、深度、艏向进行控制。四个控制器均为基于BP神经网络-Q学习算法的自适应PID控制器。四个自适应PID控制器协同配合,不断优化UUV的航迹保持效果。最后,对自适应PID控制器进行设计。通过对自适应PID控制器各模块的设计,使自适应PID控制器能够对控制参数进行实时整定,并对最优的PID控制器参数进行主动学习,很好的解决了传统PID控制器存在的控制参数无法自动调整、对环境适应性差等问题,并通过典型航迹对自适应PID控制器的参数整定效果和有、无干扰两种情况下的UUV航迹保持效果进行仿真验证。
其他文献
市场监管部门机构改革是“大部制”改革的重要实践过程。通过市场监管部门机构改革来解决以往职能交叉重复、分段监管空白等问题,使市场监管部门符合市场经济的发展要求,符合服务型政府建设的要求。2019年自下而上的市场监管体系改革已经全部完成,同时在原有市场监管职能基础上将食盐的监管执法职能、知识产权的监管执法职能和价格监督的监管执法职能一并划入。具有市场监管职能的部门已经合并,人员也统一合并,表面上看是达
我国三北、中南、西南等地区风力资源十分丰富,风电多以大规模集中式长距离的方式并网。以张北风电场为例,风电场场内集电线路众多且下游风机多以辐射式或链式汇集,场外送出线路多以远距离输送风电至负荷中心。当风电场线路发生故障后,双馈风力发电机的短路特性、风电场集电线路复杂的拓扑结构、送出线路远距离输送,都使得系统的故障特性更为复杂,传统的电力系统继电保护受到很大挑战。因此有必要针对风电场系统的结构及故障特
明治维新后,日本逐步走上了海外侵略扩张的道路。其中,以曾根俊虎为代表的兴亚论作为其海外扩张的理论支撑,对近代日本军国主义的产生和发展产生了重要影响。因此本论文选取
随着工业的发展,人民生活水平不断提高,但水污染问题却越来越严重。为了处理水污染物,各国研究学者采取了如吸附、过滤或共沉淀法来应对。近年来,通过热、紫外光或过渡金属氧化物活化过一硫酸盐(活性物质为HSO5-,PMS)的高级氧化技术逐渐得到了环境领域的广泛关注。在众多的活化方法中,过渡金属氧化物因其催化活性高,节省能源而备受关注,但对于其活化PMS的过程而言还存在一些问题,比如粉末状样品在催化完成后需
传统访问控制列表查找算法难以满足路由器在多核处理器平台下的查找需求,线性、树形、几何和递归算法在数据结构和算法方面存在一定的局限性,不能很好地发挥多核处理器的并行
文殊兰(Crinum asiaticum L.var sincum.Bak)为石蒜科文殊兰属多年生草本植物。文殊兰属植物是我国重要的药用植物来源之一,有强大的药用价值。本文以文殊兰种子为原料,对其
随着工程材料科学和现代建筑结构技术的迅速发展,膜结构建筑越来越受到建筑师们的青睐。虽然膜结构有诸多优点,但其自重轻、刚度较小,因而对冲击荷载(如风、暴雨、冰雹、风卷残物等)的作用非常敏感。在荷载作用下容易发生较大振动变形,致使膜结构产生松弛、褶皱、损伤等,甚至导致工程事故。目前膜结构动力响应的研究主要关注于风致动力响应和平面膜结构的冲击问题。以理论解析的方法对空间膜结构的冲击荷载问题的研究未见报道
本研究对目前现有的果蔬生鲜分级分类方法进行比较和概括,按照问卷设计标准制作一套科学严谨的调查问卷。以苹果为研究对象,以传感器和计算机技术为辅助,以对分拣机上的产品进行实时在线拣选为目标,设计对苹果的拣选项目、方法,通过对消费者数据的分析确定各因素权重,制定标准。以问卷的形式收集消费者数据,对数据进行信度和效度检验后使用熵值法进行分析,确定不同因素的信息效用值和在分级分类方法中的权重。在本研究中主要
随着经济、科技的发展,社会节奏越来越快,人们也逐渐感受到时间的宝贵和稀缺。对于专门培养高等人才的高校来说,早已经不是昔日人们印象中的象牙塔形象。不管是高校的学生还是工作人员,都有着同样的感受,尤其是高校里以学生为中心的工作群体——高校辅导员来说更甚。工作时间长、工作忙是高校辅导员的工作常态。研究具体现状并打破辅导员的时间困境,对于新时代辅导员队伍建设来说有着重要性和必要性。本研究从社会时间观的角度
甜瓜(Cucumis melo)是热带和温带地区的一种重要葫芦科作物,也是我国的重要经济作物。瓜类褪绿黄化病毒(Cucurbci chloratic yellows virus,CCYV)主要侵染甜瓜并且严重影响甜