基于二人零和博弈的可重构机器人系统最优控制研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:cx313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
可重构机器人与环境交互过程中利用关节模块的不同组合改变自身结构,有较强的应用扩展能力,所以可重构机器人比传统机器人更适合完成相对复杂的任务以及在非预定环境中工作。可重构机器人的“可重构”特性不仅仅表现在机械结构部分,还表现在系统先进的控制策略,可以适用机器人的不同构形,并能够完成高跟踪性能的非预定义任务。可重构机器人不可避免地在未知环境下工作,因此要综合考虑并确保系统的稳定性、鲁棒性、精确性、节能性、高效性等方面,选择合适的控制策略。在现代控制理论中,最优控制是其研究的重要部分之一,它主要研究的问题是根据受控系统,从一类允许方案中找到最适合的控制策略,使系统转移到目标状态时,定义的系统特性达到最优。对于外部环境下受到干扰的可重构机器人系统,将二人零和博弈理论引入机器人系统最优控制方法中,在定义的性能指标下,系统受到的外部干扰项与最优控制律形成对策,可重构机器人最优控制问题转换为干扰项、控制器作为“参与者”的二人零和博弈问题,求解哈密顿-雅可比-埃塞克斯方程,得到最优控制策略。然而,很难用分析法求解哈密顿-雅可比-埃塞克斯方程。自适应动态规划是新兴起的一种求解非线性系统最优控制问题的有效工具。在自适应动态规划方法中,利用函数近似结构来逼近性能指标函数与控制策略,使其满足贝尔曼最优原理,获得最优控制策略和性能指标函数。在保证外部环境干扰下可重构机器人系统控制精度与稳定性的前提下,提高可重构机器人系统的鲁棒性与节约能源消耗,建立外部环境干扰下的可重构机器人系统最优控制策略成为学者们研究的方向。本文以可重构机器人系统最优控制问题为基础,结合二人零和博弈理论,对基于二人零和博弈的可重构机器人系统最优控制问题进行深入研究。(1)可重构机器人系统的动力学建模分析可重构机器人的“可重构”特性,采用牛顿-欧拉迭代算法、关节力矩反馈方法,建立适用于机器人系统不同构形的动力学模型。并且考虑机器人的各个关节、连杆的力/力矩和关节之间的耦合力/力矩。将可重构机器人的动力学模型进行分解,将其分为多个单独的子系统,且每个子系统都建立相应的动力学模型。(2)外部碰撞下基于单评判网络策略迭代的可重构机器人零和神经最优控制基于本文建立的可重构机器人系统动力学模型,考虑外部环境下的可重构机器人系统在执行任务时容易受到碰撞的影响,无法保证其位置、速度轨迹跟踪的精确性,提出了一种基于单评判网络策略迭代的可重构机器人零和神经最优控制方法。首先,采用自适应模糊控制方法补偿可重构机器人动力学模型的不确定性,减少其对控制系统稳定性的影响。然后,考虑外部干扰对可重构机器人系统最优控制的影响,系统的最优控制律与干扰项在性能指标下形成对策,可重构机器人系统的最优控制问题转化为控制器、干扰项作为“参与者”的二人零和博弈问题。在策略迭代和自适应动态规划方法基础上,采用单评判神经网络近似性能指标函数,估计哈密顿-雅可比-埃塞克斯方程的解,得到近似的最优控制律。最后,通过李雅普诺夫函数证明系统的稳定性,建立两种不同构形的可重构机器人进行仿真实验,结果表明提出的控制方法的有效性。(3)基于事件触发的可重构机器人系统零和博弈近似最优控制依托关节力矩反馈的可重构机器人动力学模型,提出基于事件触发的可重构机器人系统零和博弈近似最优控制方法。将可重构机器人系统的动力学模型描述为包含交联耦合项关节子系统的集合,利用径向基函数(Radial Basis Function,RBF)神经网络补偿模型的不确定项。建立性能指标函数,考虑外部干扰对系统稳定性的影响,可重构机器人系统的最优控制问题转化为在干扰项、控制器作为“参与者”的二人零和博弈问题。基于自适应动态规划方法,利用评判神经网络近似性能指标函数,估计哈密顿-雅可比-埃塞克斯方程推导最优控制策略。将事件触发机制引入到机器人控制系统中,设计事件触发条件,当系统状态满足触发条件时对控制律进行更新。通过李雅普诺夫定理证明可重构机器人系统的跟踪误差是一致最终有界的,利用可重构机器人实验平台进行验证。
其他文献
随着机器人领域的研究日益成熟且应用广泛,服务于各行各业中的机器人已经是人类不可或缺的工作伙伴。依赖着科技的进步、生产力的发展,人类对于机器人的需求标准越来越高,只能执行单一任务、体积庞大、构形单一且造价高昂的传统工业机械臂已不足以满足复杂多变的任务需求。因此,可以执行多种任务、成本低且性能突出的可重构机械臂受到了广泛的关注。可重构机械臂是一类由标准模块和接口所组成的机械臂系统,能够根据不同的环境需
学位
由于移动机械臂操作空间的扩大,移动平台与环境交互能力的提高,它在交通运输、搜救、安全和监控等领域得到广泛应用。在运输过程中为节约运输成本,移动平台执行复杂任务需要进行路径规划,即选取起始点到目标点过程中的最优节点。然而在实际工况下普遍存在干扰移动机械臂运动的外力、环境冲击力、电磁干扰以及信号传输过程中的各种噪声,这些扰动会对模型求解精度、稳定性与任务完成产生重大影响,导致轨迹跟踪任务失败,并且移动
学位
模块化机器人是一种集成了驱动结构,控制结构,传感结构与执行结构模块构成的机器人,且此类模块通常具有标准的电气与机械接口,可根据不同的任务需求进行模块的增加或删减来呈现自由度个数的调整。由于机器人有着“高精度”的特点,人类具有快速判断与抉择的特点,因此人与机器人的特性可以互补,共同协作进行工作任务的完成。当人与机器人耦合在一起进行作业,人与机器人两个具有自主性的个体进行双向的信息交流,共同完成任务目
学位
立体视觉通过模拟人类双眼,获取环境的深度信息,被广泛应用在自动驾驶、虚拟现实、三维重建等领域。为提高相机成像质量,降低环境背景对模型重建精度与速度的影响、解决图像弱纹理区域误匹配问题,本文提出一种双目立体视觉方法,经相机标定、图像分割、立体匹配等技术,重建出刹车盘空间结构及表面完整点云模型。同时,针对实际工作流程中遇到的算法鲁棒性差、受光照影响大等问题提出了对应的改进方案。本文的主要工作及创新点如
学位
在河道测绘中安全生产管理为重要的组成部分。通过完善科学的安全生产管理模式,不仅可以为河道测绘提供重要的保障,还有助于提升测绘现场安全系数,使河道测绘可以更加通畅地进行,因此相关管理人员需要按照实际情况明确河道测绘测绘安全生产管理的主要要点,并且健全对应的管理方案,使河道测绘安全生产管理效果能够符合预期的要求,减少突发问题的发生几率。
期刊
目前在冶金行业,AOD炉冶炼过程中对炉内的温度测量是由操作工人将热电偶插入钢液表面进行测量。由于冶炼时的温度过高,测温过程中热电偶顶端接触钢液表面的瞬间就会损坏,就会造成同一个测温点会使用多个热电偶才能测出温度,因此增加了测温的不稳定性以及加大了热电偶的损耗,同时由于使用热电偶测温需要人工操作以及测温点少等客观因素,致使其安全性差以及冶炼原料消耗增加,产能波动大,造成所炼钢材质量不达标以致返工等问
学位
车道保持辅助系统作为先进辅助驾驶系统的核心功能,其研究主要包含两部分,一是车道线检测的前方路况识别,二是车辆横向控制策略。然而,现有车道线检测技术依赖传统机器视觉,不能很好地解决车道线信息易受光照、遮挡影响等问题;同时,大多数车道线检测技术并没有考虑相机随车身运动对信息识别带来的影响。进一步,车道保持系统研究并没有完整的将视觉系统与车道保持系统结合起来,大部分研究都处于软件仿真验证阶段。因此,本文
学位
液压提升技术是近年来我国应用很普遍的一项技术之一,液压提升系统主要由承重,动力和控制三方面组成,承重环节包括提升单元与其余系统进行配合实现高空作业。与此同时在复杂施工的场地中同样应用该技术在原理方面进行倒装拼接,空中连接,应用完善的自动化集散控制系统,保证控制的安全有效。本文针对高层建筑钢模板操作架提升控制技术研发与应用进行研究,以高层建筑多个提升单元为研究对象,构建不平衡负载钢模板执行机构。利用
学位
随着我国老龄化人口数量的迅速增长,由脑卒中等疾病造成的肢体残障人数急速增长,因此下肢康复机器人进入发展的黄金期,市场前景广阔。然而传统术后康复方法存在康复师数量不足、康复周期长和资金消耗大等缺点。在脑卒中术后康复过程中,由于患肢存在主动运动意图,会出现患肢实际运动轨迹与机器人不匹配现象,容易对患肢造成二次伤害,并且下肢康复机器人存在结构复杂、仿生性能不佳和系统抗干扰能力差等问题。所以设计简单实用、
学位
随着光纤通信近年来的发展,光纤光栅传感器发展出了各种各样类型的传感器,并且凭着自身抗电磁干扰、耐腐蚀、体积小、线性传感、易于网络化复用等优点,被广泛应用于各个领域的压力监测和温度监测,尤其是大型结构的健康监测中。本文围绕着大容量光纤布拉格光栅(Fiber Bragg Grating,FBG)的复用与组网进行研究。针对当前光纤光栅传感系统存在的复用能力不足、网络可靠性差、解调精度低、速度慢等问题,一
学位