基于强化学习的无人机悬挂负载系统控制研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hj12141
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机在军事和民用领域应用日益广泛,人们可借助无人机在复杂恶劣的环境中完成搜索和救援,运输与建筑等工作任务。无论在军事还是民用中,无人机运输都有着重要的作用。利用悬绳的搬运方式更具运输效率,成为无人机运输方向的一个崭新的研究课题。基于这样的研究背景,本课题选择使用绳索来连接重物与无人机,使无人机在保持其敏捷性的前提下,同时完成以最小摆动达到目标位置的搬运任务。无人机悬绳搬运研究领域中,现阶段常用的轨迹规划算法及控制策略,如LQR、非线性控制和最优控制等,很大程度上依赖系统模型建立的准确性。而无人机-悬挂负载为高度非线性欠驱动系统,想要建立精确的模型非常困难,简化的系统模型会大大减弱控制效果。针对以上问题,本文提出了基于强化学习的轨迹规划算法及控制策略,其对模型精确程度依赖性较小。首先,本文建立了无人机-悬挂负载系统的运动学模型及动力学模型,这两个模型将分别应用到轨迹规划器及跟踪控制器的设计中。其次,为了实现无人机利用悬绳快速且平稳地完成搬运任务,需规划出合理的搬运轨迹,相对于最优控制等较常用的轨迹规划方法,强化学习算法对系统模型依赖性小、鲁棒性好,更适合本课题的研究对象。本文采用基于近似价值函数迭代的强化学习算法来设计轨迹规划器,利用特征向量估计价值函数。为节约训练时间,在学习阶段通过下采样进行训练,再将推出的贪婪策略用于整个样本空间,生成了一系列轨迹。本文通过大量的仿真实验证明了强化学习算法在实际应用中的收敛性、鲁棒性及有效性。最后,对于无人机-悬挂负载轨迹跟踪控制问题,本文利用系统数学模型,设计出多闭环PID控制器,包括无人机-悬挂负载位置控制环、悬挂负载姿态控制环及无人机姿态控制环三部分,使系统同时跟踪无人机和负载的运动轨迹,该方法可以很好地控制负载摆动,保持系统稳定性及搬运快速性。为验证所提出的算法,本文在ROS中搭建了系统仿真平台,利用该平台对所提出算法的有效性及鲁棒性进行了验证。本论文是对无人机悬绳搬运这一新方向的探索与研究,将强化学习算法应用于轨迹规划中,并将负载的位姿信息用于轨迹跟踪控制器的设计中,对于该方向的其他研究人员是重要的参考,对于我国无人机运输的应用研究有较大意义。
其他文献
无人机作为空中机器人,涉及机械、电子、材料、空气动力学、导航与控制等多个学科,是复杂的跨学科系统。与其他移动机器人一样,导航与控制是无人机研究的核心问题,本文围绕此
作为高职院校文化创新发展旨归的工匠精神,决定了高职院校文化"为什么要创新""创新什么"以及"如何创新"的紧密问题链。工匠精神引领下的高职院校文化创新发展需要三核并举、
近年来,无人机技术无论在军用还是在民用上,都是研究领域的关注热点。随着科学技术的不断发展,无人机(Unmanned Aerial Vehicle,UAV)技术也获得了不断的发展,但是与此同时,需
2010年以来,在国家严厉的、密集的调控政策下,各大城市房地产市场运行绩效表现出差异性,但也显示地方反弹的压力。因而,如何做到调控精准化、差别化和决策科学化需要房地产重
为了解决镍钛合金丝在X光下不显影的问题,常用的解决方法是在镍钛丝的中增加铂和钽等显影核,形成一种复合镍钛合金丝。显影核占比越大,显影效果越好。但同时由于显影核材料不
目的探讨自制芒硼散冷敷对小腿骨折早期疼痛和肿胀度的影响。方法选取2014年6月—2015年10月金华市中医医院骨伤五科收治的行手术治疗的小腿骨折患者90例,按入院顺序分为对照
目的探讨抗HP药物在治疗胃十二指肠球部溃疡的临床疗效。方法选取我院收治的80例胃十二指肠球部溃疡患者依据随机法划分为参照组与研究组各40例。参照组40例患者给予埃索美拉
银行业在国内金融业中处于主体地位,提高银行业的经营管理水平、改善其经营绩效,对于整个国民经济的发展有着深远的影响。近年来,随着国内金融业的迅速发展,大量银行纷纷实行
以对硝基苯甲醛为原料,过氧化氢作氧化剂,在甲醇作溶剂的碱性条件下,一步反应合成对硝基苯甲酸.考察了碱的浓度、反应温度和物料摩尔比对反应产率的影响.实验结果表明:氢氧化
5皮肤的神经5.1运动神经:存在于皮肤的传出神经为植物神经,亦称作自主神经,属于无髓的去甲肾上腺素能和胆碱能类型,随交感神经支配真皮内的微动脉、竖毛肌以及汗腺的肌上皮细胞,在