基于积分强化学习的大柔性无人机自适应飞行控制研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户：ironfeet

【摘要】

：

【作者】

：

朋驰

【机构】

：

国防科技大学

【出处】

：

国防科技大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来随着临近空间的开发利用价值逐渐引起各国的关注和探索,临近空间飞行器如高空长航时飞机也已成为许多研究人员关注的焦点,其在高空侦察、通信保障、预警以及民用方面具备十分可观的发展潜力。本文针对一类大展弦比大柔性无人机开展基于积分强化学习的自适应飞行控制研究,具有重要理论意义和应用价值。首先,建立了面向控制的大柔性无人机动力学模型,针对一类简化的具有弹性模态的大柔性无人机,对其详细地推导了纵向动力学方程,建立了用于控制设计的数学模型,并通过线性化分析发现其不稳定的模态。为实现大柔性无人机跟踪参考指令的控制目标,基于模型参考自适应控制理论,同时考虑到所建立包含跟踪指令的模型中存在的输入输出直接馈通项,将参考模型设计为类似于龙伯格观测器的闭环参考模型,基于线性矩阵不等式（Linear matrix inequality,LMI）方法来设计闭环参考模型中引入的跟踪误差增益项,以解决系统中存在的输入输出直接馈通项,理论证明了闭环系统的稳定性,并通过仿真实验验证了设计的模型参考自适应控制器的有效性。针对大柔性无人机动力学模型部分可观和无模型情况下的控制问题,基于以强化学习理论和最优控制理论,提出了基于部分模型的次优输出镇定控制器和完全不基于模型的最优输出跟踪控制器。首先,基于on-policy的积分强化学习思想,结合自适应次优输出反馈器,通过进行在线递归计算,一个次优的反馈控制器,并通过Lyapunov直接方法证明了在线迭代计算所得的每一步控制增益都是稳定的;然后,基于off-policy的积分强化学习思想,引入状态参数化表示方法,将系统状态分解成与输入和输出相关的表达式,并在控制输入端引入探测噪声以保证系统的持续激励,以此可递归计算得到最优的输出反馈增益,并在理论上进行了证明。最后,通过数值仿真验证了控制器的有效性。考虑到实际飞行器控制系统中存在的不确定性和执行器故障等不利因素的存在,本文提出完全不基于模型的自适应容错控制方案,首先采用数据驱动的方法来得到一个最优的控制增益来作为基准控制器,然后通过设计的自适应律来在线消除各类故障的影响,以保证良好的跟踪性能。理论证明了闭环系统的最终一致有界,并仿真分析了多种故障条件下的系统性能,验证了所提出自适应容错飞行控制方案的有效性。

其他文献

“零浪费”结构设计在系扎风格服饰中的创新运用研究

时装业存在着严重的材料浪费和环境污染问题,时装在生产过程中所使用的面料很难达到100%的有效利用率,其中约15%的面料滞留在裁床上,被当作垃圾清理,进入垃圾填埋场的纺织废料会污染水、空气以及土壤。为帮助国家早日实现“双碳”战略目标,服装产业应积极响应绿色低碳的发展理念,向环保可持续的生产方式转变。服装设计师和研究者从多样化的纺织形式中寻找环保方法,将美学和技术结合开发“零浪费”纺织品。迄今已经出现

学位

敦煌散花飞天形象研究及其在服饰设计中的应用实践

敦煌飞天作为中国特色的文化符号,可以说是中国艺术家的天才创作。中原内地的传统文化与西域文化在敦煌互相交融,随着朝代的更替也经历了一步步的演变,反映出不同时代的不同艺术审美,展现出中原文化与西域文化的融合演变过程。本文通过对敦煌壁画中散花飞天的造型与服饰艺术及其四周流转的天花的装饰图案做进一步的调查性研究,研究其形象造型特点及其整体装饰性之美,并应用于现代服装艺术设计中,为今后敦煌飞天相关的研究及其

学位

基于神经网络和最优化算法的有害气体源项参数估计方法研究

近年来,随着我国“智慧城市”建设进程的不断推进,城市大气污染问题引发了更多的关注。进行有害气体扩散和溯源问题的研究对城市大气问题的监管与治理具有非常重要的意义。然而,传统的大气扩散模型存在着各自的局限,无法应用到复杂的现实场景中。通过传感器网络搜集到的数据,通常较为稀疏,数据量也比较小,无法为进一步的研究提供足够的数据支持。常见的源项参数估计方法在实际应用时也存在诸多问题。本文基于先进的神经网络技

学位

基于神经网络的磁浮列车悬浮系统辨识与控制技术研究

悬浮控制技术是磁浮列车的关键技术之一。目前控制器的设计是建立在被控对象的数学模型基础上的。悬浮系统是强非线性系统,传统的基于平衡点线性化的方法忽略了悬浮系统的非线性特征,导致线性化的模型和实际的系统存在较大的误差。另一方面,常用的基于电流环和间隙环的PID控制方法一定程度上参考了线性化的系统模型,忽略了系统在实际工作条件下的不确定性。当出现外部干扰或者系统内部参数变化时,固定的控制参数会影响系统的

学位

VR眼镜中的中文界面字体排版研究——以办公家具体验为例

随着数字化技术的发展,虚拟现实（Virtual Reality,简称VR）相关应用越来越广泛。当用户使用VR眼镜（头戴式虚拟现实设备）时,可以体验虚拟三维交互场景。这类交互方式为用户带来了全新的体验,弥补了用户对三维空间感知的缺乏,打破了传统电子屏幕的二维世界。但就当前而言,VR眼镜的界面中文排版发展并不成熟,缺少对虚拟三维空间利用,大多数还是传统二维媒介的设计思维,较少有针对性,无法满足用户在虚

学位

综合护理措施对ICU感染性休克患者的疗效及预后改善的效果分析

目的：分析对ICU感染性休克患者实施综合护理的疗效及对预后改善的影响。方法：选取2019年3月—2020年3月商丘市第一人民医院ICU收治的62例感染性休克患者作为研究对象，将其按照随机数表法进行分组，每组各31例。对照组患者接受常规护理，实验组患者接受综合护理。对两组患者的心率、心脏指数、平均血压等临床指标变化情况、护理满意度、血清C反应蛋白（CRP）水平以及护理有效率进行对比分析。结果：观察两

期刊

温致变色材料在现代服装设计中的应用研究

随着科学技术的发展与化工水平的提升,消费者对于服饰美的追求层次日益提高,科技化、创新化、动态化正在成为服饰色彩未来的发展趋向。温致变色材料作为一种智能材料,可以随内外环境温度的变化而产生“动态”的色彩效果,具有一定的趣味性和科技感。目前在商业市场上流通的温致变色服装款式较为简单,且对温致变色材料的应用手法较为单一,无法满足求新求异、多元化的新一代消费者。因此,挖掘温致变色材料在现代服装设计中的应用

学位

江西省∣江西启动职业年金投管人和托管人评选

＜正＞4月16日,江西省社会保险管理中心发布"江西省职业年金计划投资管理人评选公告"和"江西省职业年金计划托管人评选公告",这标志着江西省职业年金基金投资运作又迈出一步。根据公告,江西省职业年金计划投资管理人和托管人的评选中,可以参选的机构分别是具有企业年金基金投资管理资格的管理机构和具有企业年金基金

会议

基于空间四叉树的多无人机协同观测多运动目标技术研究与实现

多无人机协同观测多运动目标是智能无人集群的一个典型问题。多无人机协同观测多运动目标可以广泛的应用于环境安全监测、灾区人员救援、野生动物保护等任务中。该问题最主要的挑战是:在目标的运动是随机的前提下,如何能够预测目标的移动趋势,计划无人机的移动路径,使得更多的目标处于无人机的观测下并且目标被观测的时长较为均衡和公平。为此,本文针对多无人机协同观测多运动目标的观测时长和观测均衡性展开研究,提出了一种基

学位

基于神经网络的程序合成优化方法研究

程序合成（又叫程序综合、程序自动生成）,作为人工智能领域的“圣杯”自诞生以来就受到了密切的关注,它的目标是自动查找满足以某种形式约束表示的用户意图的程序。当前的程序合成研究有了一些发展,但仍然面临着许多问题和挑战。首当其冲的是当前得程序合成技术合成精度有限,只能解决一些功能简单、规模较小的编程任务。同时,对于合成得到的代码,很难在逻辑上验证其正确性,其合成结果质量无法保证。此外,许多程序合成方法局

学位

基于积分强化学习的大柔性无人机自适应飞行控制研究

与本文相关的学术论文