基于强化学习的扑翼飞行机器人控制设计与研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:net_worm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,随着微机电技术、机器人技术、新材料技术和新能源技术的快速发展,对扑翼飞行机器人的研究也逐渐进入快车道,并得到了来自很多国家的关注。相比较传统的飞行方式,扑翼式飞行在能源利用率、灵活性以及伪装性方面都有较大的优势。因此,研发新型的扑翼飞行机器人将是未来飞行器研究的重要方向。与此同时,更智能化、更高效的控制方式的研究也迫切需要。本篇论文主要研究强化学习在扑翼飞行机器人的姿态控制和位置控制方面的应用。首先,本文将从扑翼飞行机器人的系统建模出发,考虑一个六自由度的仿蜂鸟模型作为研究对象,再通过建立合适的坐标系和运动学分析,得到系统的动力学方程。然后再基于仿蜂鸟扑翼飞行机器人的系统动力学方程,引入强化学习的典型框架:Actor-Critic算法进行控制策略的设计,并根据Lyapunov稳定性理论证明了系统的稳定性。鉴于神经网络在处理不确定性和非线性方面的良好特性,神经网络被用于搭建Actor网络和Critic网络,并且基于Actor网络设计了强化学习控制器。其中Actor神经网络用于实现对连续策略空间的逼近,Critic神经网络则用于实现对值函数的逼近。此外,PD控制器被设计用于和强化学习控制器进行比较,并通过MATLAB仿真平台进行了控制器可行性和控制效果的验证。此外,本文还对扑翼飞行机器人的姿态运动和位置运动分别进行了研究。对于姿态运动,系统模型是未知的,因此通过引入神经网络来处理系统的不确定性,同时考虑系统状态变量全部已知和部分已知两种情况,分别设计全状态反馈神经网络控制器和输出反馈神经网络控制器来实现对姿态运动的控制。对于位置运动,系统模型是已知的,因此设计基于模型的控制器来实现对位置运动的控制。系统的稳定性和控制器的可行性和控制效果分别通过Lyapunov理论和MATLAB仿真平台得到了验证。
其他文献
<正> 论文叙述了在瑞典地方环境健康当局中,对低频噪声引起申诉的调查结果。结果表明:由低频噪声引起的申诉是所有噪声申诉的大多数。报告说,绝大多数的低频噪声通常是通风机
目的 报道辨证治疗神经根型颈椎病的临床经验,方法 1996年2月~1998年3月共治疗神经根型颈椎病89例。运用内治与外治相结合,辨证施治。以中药内服为主,配合按摩、牵引、局部穴位
商业银行作为银行业的主要组成部分,存在着各种各样的风险,而商业银行的会计风险是商业银行的主要风险之一。本文对我国商业银行会计风险内容及种类进行了分析,并提出了具体
采用盆栽试验,分析盐胁迫下添加黄腐酸有机肥对刺槐1年生幼苗成活率、相对生长速率、最大净光合速率、叶片含水量、生物量分配和根系特征的影响。结果表明:与低盐胁迫相比,高
为促进高校体育教育专业基本功大赛健康持续发展,提高体育教育专业办学水平,运用文献资料法、专家访谈法、实地调查法对2014年全国体育教育专业学生基本功大赛举办过程中的主
许多中国人对葡萄牙的了解,并不比对澳门地区的了解多.当年叱咤风云的西欧强国,现在的经济状况却落后很多.葡萄牙正处于新的经济发展时期,市场空白点多,许多领域急需投资.
研究了土壤温度和湿度对南方根结线虫侵染番茄根部能力的影响。结果表明,在42℃和-15℃处理3d后可使二龄幼虫丧失侵染能力,在0℃、40℃和土壤含水量20.7%~36.2%时,可有效降低二龄幼虫
文章运用文献资料法、专家访谈法、比较研究法和逻辑分析法等研究方法,对陈鹤琴和蒙台梭利幼儿健身思想进行对比与分析。陈鹤琴、蒙台梭利都出生于19世纪末,都深受自然主义教
<正>痰,是一种病理产物,可以停滞在机体各个组织器官之中而产生各种痰病。自先秦以迄明清,古代医学在各自的医疗实践中,从不同的角度,不断地补充、完善、整理、提高,从而大大
目的:分析在舌癌旁组织及舌鳞状细胞癌组织中microRNA-21以及线粒体凋亡通路相关基因Caspase-3、Caspase-9的表达情况。方法:采用实时荧光定量PCR方法检测33例符合纳入标准的