论文部分内容阅读
可重构机器人可以根据不同的任务需求对自身构形进行重新组合与配置,从而表现出许多传统机器人所不具有的优势。“模块化”与“可重构”作为可重构机器人设计的两大基本要求,其主要思想是将一个复杂的机器人系统分解为多个具有较高便携性与可维护性的子系统,从而有效缩短机器人系统的设计与制造的周期。可重构机器人系统不可避免在未知环境下完成工作,并且要综合考虑并确保系统的稳定性、鲁棒性、精确性、节能性等指标,因此在环境信息不确定的条件下采用合适的控制策略是十分必要的。最优控制作为现代控制理论的重要组成部分,其研究的核心问题是对于一个给定的被控系统,选择合适的控制策略使系统的某些性能指标达到最优。对于可重构机器人系统,获取其最优控制策略则需要求解哈密顿-雅克比-贝尔曼方程,而该方程是一类非线性偏微分方程,难以用解析方法求得最优解。自适应动态规划方法是一种解决非线性系统最优控制问题的强有力工具,在自适应动态规划系统中,神经网络被设计用来近似性能指标函数并估计哈密顿-雅克比-贝尔曼方程的解。为了在提高可重构机器人系统控制性能的同时降低控制器所需的能耗代价,本文将自适应动态规划方法与最优控制理论相结合,研究可重构机器人系统的最优控制方法,具体内容包括:(1)可重构机器人系统的动力学建模针对牛顿-欧拉迭代形式的可重构机器人以及基于关节力矩反馈的可重构机器人系统进行了动力学模型的建立以及分析,考虑作用在各个关节及连杆上的力/力矩以及关节间的耦合力/力矩,建立可重构机器人的动力学模型。在此基础上,基于局部的关节动力学信息,将机器人系统动力学模型分解为若干个动力学子系统,深入分析子系统动力学特性,建立了每一个模块的动力学模型。(2)基于自适应动态规划的可重构机器人系统分散积分滑模最优控制本文已建立的可重构机器人的动力学模型,研究了一种基于积分滑模的可重构机器人最优控制算法,解决了机器人快速平稳的轨迹跟踪问题和子系统之间的交联耦合项辨识的问题。本文将自适应动态规划方法扩展到了分散积分滑模的算法之中,并且将神经网络辨识器与自适应动态规划相结合,构成了评判-辨识结构,解决了子系统之间的交联耦合项最优辨识与补偿问题。基于自适应动态规划以及在线策略迭代算法,实现了哈密顿-雅克比-贝尔曼方程的单评判网络近似求解并得到最优容许控制策略。(3)不确定任务环境下可重构机器人系统的分散鲁棒零和神经-最优控制通过采用基于关节力矩反馈的可重构机器人系统动力学模型,针对机器人面对不确定的任务环境,给出了一种基于二人零和博弈的可重构机器人最优控制算法,解决了机器人的位置以及速度跟踪问题。该部分内容提出了面对不确定环境的可重构机器人系统零和神经-最优分散控制方法,将未知环境接触与机器人最优控制考虑为零和微分博弈下的两个参与者,并以此将面向未知环境的可重构机器人系统的鲁棒控制问题转换为最优控制问题,并基于自适应动态规划算法,提出一类新颖的零和神经-最优控制方法。基于李雅普诺夫理论,闭环机器人系统在提出的分散控制律下保证渐近稳定,最后在实验平台验证了算法的有效性。