论文部分内容阅读
模块化仿蛇机器人多关节、超冗余自由度的特性使其能够根据环境变化灵活改变相应运动形式,具有极强的地形适应能力。将此类机器人应用于灾害搜救、军事侦察、管道巡检等领域,将极大提高机器人在以上复杂、受限、非结构环境中的工作效率。目前国内外对仿蛇机器人的研究主要停留在对生物蛇身体结构以及少数几种蛇类运动步态的模仿,机构设计的局限与运动控制方法研究的不完善使其环境适应能力与运动效率难以提高。因此,本文重点研究针对模块化仿蛇机器人的建模与运动控制方法,以期改善仿蛇机器人的运动性能与智能化程度。本文的主要研究内容包括:
1、基于旋量理论的仿蛇机器人运动学与动力学建模。在对生物蛇运动机理分析的基础上,研究模块化仿生并联关节机构设计。基于旋量理论分析仿生并联关节运动性能,确定机构约束条件与自由度。运用辅助旋量与李代数,研究并联关节速度与加速度求解方法。运用等效机构法结合完整约束,研究蜿蜒步态下仿蛇机器人各关节运动状态与整体位姿之间的关系,建立相应运动学模型。通过建立仿蛇机器人的力与力矩平衡方程,研究其关节驱动力矩与运动状态之间的关系,建立对应动力学模型,为路径跟踪控制提供理论支撑;
2、基于近似动态规划的仿蛇机器人最优路径跟踪控制。基于微分几何理论结合虚拟完整约束,研究仿蛇机器人动力学模型化简方法。运用约减后的动力学模型结合视线制导策略,构建考虑模型不确定因素的仿蛇机器人最优路径跟踪目标函数。基于动态近似规划,研究以上路径跟踪目标函数对应的哈密顿-雅可比-贝尔曼方程在线求解方法。在此基础上结合经验回放技术,研究评价神经网络权值更新策略,构建仿蛇机器人最优路径跟踪控制在线学习框架;
3、基于深度强化学习的仿蛇机器人步态自主涌现。运用泰勒展开同策略梯度方程,研究结合异策略强化学习梯度估计的策略融合方法,提高同策略强化学习方法的样本利用率,同时降低策略梯度估计方差,稳定步态学习过程。基于参数空间探索技术,研究针对仿蛇机器人步态控制策略的高效探索机制,提高机器人步态探索效率并保证输出动作的一致性。在此基础上结合异步并行技术,研究分布式解耦的行动-评价深度强化学习框架,最大化数据吞吐量,获得不基于模型的仿蛇机器人步态自主涌现控制策略;
4、基于元学习的仿蛇机器人运动步态快速生成。运用异方差数据增强技术,研究针对仿蛇机器人动态模型的抗过拟合训练方法,打破机器人历史状态数据集的关联性同时提高训练后模型的鲁棒性。基于元学习理论,构建多任务近似元强化学习训练框架,降低高阶策略梯度估计方差。随后运用该框架从仿蛇机器人动态集成模型中采样“假想”的运动轨迹,降低算法对真实机器人状态数据的依赖,提高其样本利用率。运用并行计算技术,研究针对仿蛇机器人步态搜索框架的分布式训练方法,提高步态控制策略的搜索效率。
1、基于旋量理论的仿蛇机器人运动学与动力学建模。在对生物蛇运动机理分析的基础上,研究模块化仿生并联关节机构设计。基于旋量理论分析仿生并联关节运动性能,确定机构约束条件与自由度。运用辅助旋量与李代数,研究并联关节速度与加速度求解方法。运用等效机构法结合完整约束,研究蜿蜒步态下仿蛇机器人各关节运动状态与整体位姿之间的关系,建立相应运动学模型。通过建立仿蛇机器人的力与力矩平衡方程,研究其关节驱动力矩与运动状态之间的关系,建立对应动力学模型,为路径跟踪控制提供理论支撑;
2、基于近似动态规划的仿蛇机器人最优路径跟踪控制。基于微分几何理论结合虚拟完整约束,研究仿蛇机器人动力学模型化简方法。运用约减后的动力学模型结合视线制导策略,构建考虑模型不确定因素的仿蛇机器人最优路径跟踪目标函数。基于动态近似规划,研究以上路径跟踪目标函数对应的哈密顿-雅可比-贝尔曼方程在线求解方法。在此基础上结合经验回放技术,研究评价神经网络权值更新策略,构建仿蛇机器人最优路径跟踪控制在线学习框架;
3、基于深度强化学习的仿蛇机器人步态自主涌现。运用泰勒展开同策略梯度方程,研究结合异策略强化学习梯度估计的策略融合方法,提高同策略强化学习方法的样本利用率,同时降低策略梯度估计方差,稳定步态学习过程。基于参数空间探索技术,研究针对仿蛇机器人步态控制策略的高效探索机制,提高机器人步态探索效率并保证输出动作的一致性。在此基础上结合异步并行技术,研究分布式解耦的行动-评价深度强化学习框架,最大化数据吞吐量,获得不基于模型的仿蛇机器人步态自主涌现控制策略;
4、基于元学习的仿蛇机器人运动步态快速生成。运用异方差数据增强技术,研究针对仿蛇机器人动态模型的抗过拟合训练方法,打破机器人历史状态数据集的关联性同时提高训练后模型的鲁棒性。基于元学习理论,构建多任务近似元强化学习训练框架,降低高阶策略梯度估计方差。随后运用该框架从仿蛇机器人动态集成模型中采样“假想”的运动轨迹,降低算法对真实机器人状态数据的依赖,提高其样本利用率。运用并行计算技术,研究针对仿蛇机器人步态搜索框架的分布式训练方法,提高步态控制策略的搜索效率。