基于强化学习的小型无人直升机导航与控制研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:shaodongjia1668
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于小型无人直升机能够垂直起降,飞行灵活多变,同时相比多旋翼具有更大的载重量,因此在军用和民用中发挥着越来越大的作用。但是由于其自身的非线性、强耦合性、以及隐藏状态多且不易测量的特点,使得对无人直升机的自主控制始终存在着巨大的困难和挑战,许多实际飞行任务仍需要人工操作控制。另一方面,由于无人机执行的任务和面临的周围环境越来越复杂,因此一个便捷而有效的避障与路径规划方法也变得至关重要。本文以无人直升机为主要研究对象,以具有较强自主学习能力的强化学习(Reinforcement learning,RL)方法为基础,结合深度学习方法,设计了无人机的自主导航策略、姿态控制策略以及高度控制策略。并通过实验进行验证。本文完成的主要研究工作如下。首先,本文采用强化学习中的Q学习法作为无人机自主导航控制的核心算法。但是传统的基于表格的Q学习方法面对实际飞行中产生的大量状态,易产生“维数灾难”的问题。因此,本文采用深度神经网络直接对环境图像进行处理得到状态变量,用神经网络代替表格模拟Q值,通过模拟无人机对象和环境的实时交互过程训练网络参数,进而实现了无人机能够沿最短路径在躲避障碍物的同时到达指定终点的任务。其次,为了有效补偿小型无人直升机姿态控制中模型不确定部分的影响,本文首先将直升机的动力学模型分为标称模型和建模不确定两部分。接着针对标称模型部分,设计了一种基于误差符号函数积分的鲁棒控制算法,减小了外界风扰的影响;针对建模不确定部分,设计了基于在线增强化学习的控制算法,对模型不确定性进行了补偿。并利用基于Lyapunov分析的方法,证明了无人机姿态控制误差的半全局渐近收敛。随后在无人直升机半实物实验平台上,进行了姿态控制的实时实验验证。实验结果表明,本文提出的控制方法取得较高的控制精度,同时在系统不确定性和扰动同时存在时具有良好的鲁棒性。最后,本文采用基于离线强化学习的方法为自主研制的微小型无人直升机设计了高度控制器。该方法利用先验的实际飞行数据建立局部加权线性回归模型,并基于该模型通过随机逼近的迭代方法不断优化代价函数,从而优化控制器的参数。同时利用概率方法证明了随机逼近策略的最优收敛性。将离线训练后得到的控制器参数带入无人直升机实际飞行中,对高度的控制误差明显低于手动调参的控制器,取得了良好的控制效果,同时也减小了参数调节的时间。
其他文献
目的:采用颌后切口经腮腺前缘入路与穿腮腺入路2种术式分别治疗髁突骨折,比较2种手术方式的术后疗效。方法:选择2013年1月~2017年6月我院收治的52例髁突骨折病人,随机分为2组
在市场经济环境下,企业的产品越来越多样化,企业间的竞争越来越激烈,某些企业产品的间接费用在产品成本中所占的比重相对较大,若管理者仍坚持按照传统的成本核算方法计算成本,如按照产量或工时等单一的分配标准分配间接费用,就不能准确的反映企业产品的真实成本信息。而作业成本法是按照企业产品的生产工艺流程划分为不同作业中心,按照作业特点确定作业动因,通过作业消耗资源,产品消耗作业来确定最终的产品成本信息。作业成
根据悬移质输沙率测验测定断面平均含沙量符合部分流量加权法的原理,推算出利用垂线相应的流量权重系数与垂线的平均含沙量直接计算出断面平均含沙量的公式。这种利用取样垂线
随着教育改革不断深化,教学结构和教育方式发生转变,出现了交互式微课这种新型的教学形式。利用交互式微课辅助教学不仅顺应了教育信息化的发展趋势,而且还满足了教师职业发展与学生生物学科核心素养发展的需求,在现代教育技术课堂中具有不可替代的作用。本研究基于ActivePresenter软件,对高中生物学交互式微课的设计和应用进行探究,以期丰富高中生物的交互式微课资源。以认知负荷理论、联通主义学习观与交互观
农村信息化的定位应该是以服务"三农"为基础,以推进"三化"(工业化、城镇化、农业产业化)为方向,根本的问题是提高农民的信息能力,只要农民从被动接受信息化服务到主动来参与
婚姻到了三天一大吵、两天一小吵的时候,就跟嚼淡而无味的口香糖差不多了,只有一吐为快。于是,就准备离婚,他们就心平气和地到街道办事处去办理离婚手续。办理离婚的一位女士
大象是地球上最庞大的陆生动物,人类的急剧扩张和气候的变化,让象群的居住地日趋萎缩,贵重的象牙更令它们付出生命的代价。在非洲,每天都会有大象与村民冲突的报告。人类是大
空调系统一般有风机盘管系统和全空气系统,风机盘管系统一般适合于办公、会议等场所,采用就地温控开关控制.全空气系统一般应用于大堂、多功能厅等大空间场所,其空调机组有定
近年来,伴随着经济社会的快速发展和城市化进程的推进,城市生活垃圾迅速增长。城市管理者们面临的“垃圾围城”越来越成为制约城市生存发展所不可忽视的因素之一。如果生活垃圾处置不得当,将污染大气、土壤和地下水,进而影响城市生态和经济社会发展。因此,当前城市管理者面临着一项重要课题,即实行生活垃圾的分类治理,从源头上减少生活垃圾的产生,对可回收生活垃圾开展回收利用,推动生活垃圾无害化处理。垃圾分类是习近平总
目的:使用超声骨刀联合高速涡轮钻及单纯使用涡轮钻拔除下颌复杂阻生第三磨牙,对比两种不同微创术式在术中及术后的各项临床指标,评价超声骨刀在下颌复杂阻生第三磨牙拔除术中的临床疗效。方法:选取2018年2月2019年8月在山西医科大学第一医院口腔外科行下颌阻生第三磨牙拔除术的患者80例(共80颗患牙)作为研究对象,且均符合胡开进等关于下颌阻生第三磨牙拔除难度系数评分法中判定为较难或困难的患牙。将研究对象