基于迁移学习的水陆两栖平台控制方法研究

来源 :江苏科技大学 | 被引量 : 0次 | 上传用户:litao343243581
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
水陆两栖平台结合了车与船的双重性能,既可像汽车一样在陆地上行驶穿梭,又可像船一样在水上泛水浮渡的特种车辆。由于其具备卓越的水陆通行性能,所以在军事、救灾救难、探测等专业领域已经大放异彩。迁移学习是一种新的机器学习范式,可以通过从外界获取先验知识来提高学习的效率。本文旨在使用迁移学习缓解强化学习在进行两栖平台运动控制时需要以不断试错的方式与环境交互而导致训练时间长、模型收敛慢的问题。所以本文使用迁移强化学习算法对两栖平台的轨迹控制进行研究,主要研究内容和工作如下:(1)首先对目前两栖平台的船体类型和驱动方式的优缺点进行分析与论述,然后确定了本文的水陆两栖平台为双体船,陆地采用履带驱动,水面使用螺旋桨推进。然后使用SOLIDWORKS软件设计了本文水陆两栖平台的虚拟样机,并在STAR-CCM+水动力性能软件中对设计的虚拟样机进行运行阻力分析。(2)由于两栖平台是一种具有多种工作环境的智能体,在不同环境下具有不同的运动数学模型,所以本文将两栖平台的运动控制任务分为陆上轨迹控制和水面轨迹控制。首先对陆地任务展开研究,通过使用Matlab中的强化学习工具包为其搭建仿真环境,并提出了一种从演示中学习的间接策略迁移算法,通过使用源任务的先验知识训练一个用于目标任务动作指导的专家网络,并且将专家网络用于评价网络的更新。该算法不仅可以使智能体在训练初期快速学习到有用的知识,而且可以避免在训练后期输出的动作被专家网络限制。(3)在水面控制任务中,引入了循环神经网络,使智能体不仅能够迁移源任务的知识,还可以根据自己训练过程中产生的历史先验知识对未来做出判断,从而使两栖平台在进行动态目标点跟踪时能够以更合理的动作序列去探索环境,减小训练初期的动作空间复杂度,从而避免网络训练的冷启动。
其他文献
船舶在如今的运输行业中占据重要地位,船舶的推进效率以及其营运成本是国内外关注的重点。船体的主要动力来源是船体的螺旋桨,螺旋桨与船体之间匹配程度的高低对于船体的快速性和经济性有着重要影响;吊舱推进器是一种新型的船体推进系统,其设计的优良性对船体操纵性和航行性能都有显著的提升,在船舶的推进领域的关注度越来越高。因此对船和吊舱推进器耦合下的船体性能和吊舱推进器水动力性能进行深入的研究对船舶的设计和发展有
学位
随着互联网中的信息过载问题越来越严重,高效地检索出用户感兴趣的内容变得越来越困难。推荐系统作为一种能够从海量数据中挖掘有价值的信息,并且主动为用户提供个性化服务的技术,受到了广泛的关注。目前,推荐系统已经和我们的日常生活息息相关,尤其是在发展迅速的视频领域,推荐系统可以帮助用户快速定位感兴趣的视频信息。本文针对传统推荐算法中的数据稀疏、推荐准确度不高以及提取特征不充分问题,提出一种基于深度学习的混
学位
船舶的动力装置及辅助机械产生的大量噪音会严重影响船员及乘客的健康,为此,国际海事组织对船舶舱室噪声的限值提出了越来越严格的要求;船舶噪声控制既是国内外研究的热点,也是亟待解决的问题。本文在兼顾基本力学性能和轻量化的前提下,以隔声性能为主要指标,设计了横向蜂窝夹层板,并通过对其进行细观结构设计和优化,以期提高其隔声性能,从而有效降低船舶舱室的噪声。本文设计了多种包含形状芯层的横向蜂窝夹层板结构,在等
学位
期刊
学位
造船是典型的离散生产,胎架、焊机、切割机等设备是船舶建造的关键工艺设备,它们的运行状态决定了分段施工的效率和准确性。然而目前,船舶建造业对工艺设备的管理仍以人工定期巡查和纸质报表记录为主要方式,普遍存在设备运行数据记录不完整、不及时,设备状态评估不准确、不充分,数据可视化程度低、重用困难等问题,其已成为制约我国船舶建造精益发展的瓶颈。近年来,信息通信技术飞速发展,船舶建造逐渐朝着智能化、数字化方向
学位
随着人工智能、大数据等技术的发展,目标跟踪技术被广泛应用到智能监控、医疗诊断、精准制导、智慧城市等领域。基于相关滤波的跟踪算法因其在频域进行运算,能够以较快的速度实现高效定位,因此在目标跟踪领域得到了广泛应用。然而,在相关滤波方法中仍然存在一些问题,其一是循环位移引起的边界效应;其二是对跟踪结果缺少可靠性评估,导致算法模型发生漂移;其三是特征描述能力不足;其四是固定的目标尺度影响跟踪性能。针对以上
学位
近年来,随着“通用型”FPSO概念的提出,FPSO市场迎来了发展的机遇期,由于通用型FPSO比普通FPSO适用性更广,但设计要求更高,因此船用关键管网系统的稳定运行以及各种系泊方式的设计等得到了学术界的广泛关注。故本文以“通用型FPSO关键管网系统”作为研究对象,对其内部的流体流动稳定性进行研究,并从管系中常出现的多相段塞流现象以及压力脉冲现象两个角度出发,分别探究以上现象对管网系统的影响。通过计
学位
“双碳”战略目标下,建筑行业的产业链正在加速转型升级,使用低价值废料和可再生原料生产建材以及可再生循环利用废料,都有利于降低建筑全生命周期的碳排放。作为低价值废料,废旧轮胎可循环利用替代建材,缓解部分建材在生产过程中的碳排放问题。废旧轮胎胎面挡土墙则是低碳处理废旧轮胎的一种有效途径,但模块式废旧轮胎胎面挡土墙极易不稳定,为了提高胎面挡土墙的稳定性,本文提出了格栅条带式及返包式加筋塞土轮胎的方法,而
学位
船用柴油机机身是船用柴油机的关重件,其结构复杂、加工工艺繁复,对于制造过程的可靠性及精度的准确性具有极高的要求。残余应力是影响工件质量的一个重要因素,机身加工过程中多工序耦合导致应力叠加与重分布,进而影响机身变形,大大降低了机身的成品率。工件内部存在残余应力会严重影响其使用寿命和精度。以往针对大型构件的研究大多是针对某一过程或几个过程无关联的应力研究,无法准确地得出系统性的多工序耦合下残余应力演变
学位