基于强化学习的水下机器人追踪控制算法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:abc37562735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着海洋中丰富的资源逐渐被人们认知,海洋愈发成为各个国家争取海洋权益、发展尖端科技和展示综合国力的重要场所。水下机器人作为探索海洋、执行海洋任务的重要工具。随着探索海洋领域的需求不断增多,亟需重点提升水下机器人的自主能力和面对风险事件的可靠性。水下机器人的轨迹追踪技术是水下机器人控制所面临的重要关键技术,轨迹的准确追踪是水下机器人在复杂的海洋环境下执行任务的基础,并且现阶段很少有对水下机器人追踪与定位问题的联合研究。本文针对上述问题,考虑水下机器人模型不确定约束,开展水下机器人轨迹追踪和编队控制算法研究,本文的工作主要有以下几个方面:(1)针对水下机器人在轨迹追踪过程中误差大,控制策略难调整的问题,设计了一种于强化学习的追踪控制方法,为了减少获取系统均值的计算量,采用了一种多元概率配置法结合正交部分因子对模型不确定参数进行采样,实现了在水下机器人模型参数不确定的情况下通过和环境交互求解控制策略来完成轨迹追踪任务。最后通过仿真验证了提出的算法能够实现良好的轨迹追踪效果。(2)针对水下机器人在动力学模型约束下的位置不可测问题,进行了定位与追踪控制的联合设计,在水下机器人位置能够精确获取的基础上,设计了基于强化学习的追踪控制算法,提高了水下机器人追踪控制精度,减小了追踪误差。最后通过仿真和水池实验验证了水下机器人轨迹追踪算法的有效性。(3)在单个水下机器人的追踪控制问题基础上,进一步考虑多水下机器人的编队控制问题,针对多水下机器人追踪的协调问题,建立了水下机器人编队的有向拓扑图,设计了一种基于强化学习的编队控制方法,使多个水下机器人在目标追踪过程中能够实现编队的形成和保持,弥补了单水下机器人追踪的不足。
其他文献
大中小学德育一体化建设是德育工作长久以来所关注的主题,是实现教育强国和培养全面发展的人的要求,也是德育工作走向深水区的必然结果。新时期大中小学德育一体化可以从横向和纵向两个方面来探析其基本内涵,从横向来看是学校、家庭、社会德育的横向贯通;从纵向来看是小学、初中、高中、大学的系统化德育。在当前德育一体化建设背景下,小学德育可以从目标定位、资源选取、方式方法、评价体系、环境塑造五个方面进行整体架构。推
由于钢铁材料在空气中极易被腐蚀,所以保护和减少因腐蚀所造成的钢铁材料的损失变得尤为重要,因此可以采用电沉积的方式用来保护钢铁材料。在工业材料的发展过程中需要降低材料成本的同时极大的丰富材料的各种性能,所以表面改性技术变得尤为重要,微弧氧化工艺就是典型的表面改性技术的一种,经微弧氧化工艺处理后可以赋予材料更加优异的性能。本论文采用NaCl-KCl-AlCl3(摩尔比为1:1:4)三熔盐体系,并且加入
水下数据收集是水下传感器网络应用研究的基础。在水下传感器网络中,传感器节点的部署稀疏性的特点,限制了水下数据收集的范围。水下潜器凭借其灵活性和自主性扩大了网络的覆盖范围。然而,尽管可以通过部署潜器来达到水下传感器网络自主性的提升,但是潜器的昂贵限制了其规模化的部署。针对上述问题,本文在传感器网络的基础上增加部署少量潜器,设计了一种基于潜器协同的水下数据收集算法。本文的主要研究工作如下:1.针对传感
根据最新统计,近10年内数据流量增加了约1000倍。这使得传统的蜂窝网络结构面临着巨大的挑战。设备对设备(D2D)通信在提高频谱利用率、减少传输延迟、卸载流量、扩展带宽、覆盖范围和降低系统能耗等方面具有巨大的潜力。然而,将D2D通信引入传统的蜂窝网络也面临着一些问题和挑战:如何最大限度地减少D2D通信共享频谱资源产生的有害干扰,提高系统的总速率;如何处理实际通信环境中非理想的信道信息。针对以上问题
中小学德育一体化视域下学校德育活动设计应得到相应的指导。以行为规范教育活动为例,可从各学段学生行为规范素养现状和特点、发展要求出发,明确行为规范教育活动设计应遵循的核心理念,选择适切的德育活动方法并恰当使用,从而实现各学段行为规范教育活动的独立性、连续性及整体性的辩证统一,提升学校德育实效。
化石燃料的过度使用造成的环境问题日益加剧,新能源的使用成为未来发展的重要方向,电动汽车作为新能源动力汽车受到了广泛关注。但是电动汽车用户的随机充电行为形成的功率负荷将会影响电网的平稳运行,需要对其进行合理的引导。电价调度作为一种重要的调度方法能直接作用于用户,具有很强的针对性和有效性。电价调度的核心内容为电价制定的具体方案,因此需要对电价的制定进行研究,从而对电动汽车用户充电进行合理调度并保证电网
近年来,随着计算机科学技术、人工智能技术和网络化控制技术的飞速发展,多智能体系统(Multi-Agent Systems,MASs)已经被广泛应用到智能电网、智慧交通、自动驾驶、传感器网络等多种领域。由于多智能体系统具有自主性、容错性、灵活性和协作性等特点,因此如何在复杂环境中相互协调、共同完成任务则成为实现多智能体协同控制的重要前提。注意到智能体之间是通过网络进行信息交互,网络的存在又会带来全新
篦冷机是水泥熟料生产过程中的重要设备之一,其主要功能是冷却及输送水泥熟料。深入研究篦冷机内熟料换热规律,进而提高熟料冷却效果及系统热回收率,是实现水泥行业节能减排,绿色可持续发展的关键。在熟料堆积体换热过程中,由于颗粒间的接触使得接触点处(命名为高温红点区)温度较高,随着料层的流动,高温红点区脱离接触区与冷却空气接触,进而增加了整体的换热强度。而以往的熟料堆积体换热研究中的静态模型,忽略了红点区的
随着人类社会科技与文明的发展进步,人们对于资源损耗、能源安全和环境保护等问题愈发重视。如今,以绿色能源为动力的电动汽车已替代传统燃油车在众多国家中成为常见的零排放和可持续的交通工具。然而,由于电动汽车续驶里程短,充电场所较少且充电站运营商与有充电需求的电动汽车用户之间缺乏有效的信息交互导致了电动汽车用户里程焦虑,充电站利用率不平衡且负荷峰谷差距大等一系列问题。为此,本文结合用户的车辆信息、交通信息
自动驾驶农机车精确轨迹跟踪控制是实现农机车沿预期轨迹行驶及完成农业精准作业的关键技术,也是实现农机车自主作业的关键一环。自动驾驶农机车快速且精确的轨迹跟踪控制有利于降低农作物损坏率和车辆油耗等,进而减少作业过程中产生不必要的经济损失。此外,农机车系统建模过程中存在的非线性和参数不确定性因素会增加轨迹跟踪控制的难度,农田环境下存在的未知外部扰动也会影响农机车跟踪的精度。因此,本论文针对带有非线性、参