面向在轨组装地面演示系统的冗余机械臂智能化关键技术研究

来源 :中国科学院大学(中国科学院长春光学精密机械与物理研究所) | 被引量 : 0次 | 上传用户:nibaba
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国航空航天技术的不断发展,大型空间设备和空间系统的需求变得愈加迫切。受客观条件制约,很难将大型空间设备直接发射入轨。将其分为多个子系统模块,分批发射后实施在轨组装,是现阶段内可行性最高的方案。在轨组装技术对于未来航空航天事业发展的重要性不言而喻。在轨组装任务复杂,工作模块复杂且昂贵,对机械臂的移动精确性和末端柔顺性有极高需求。冗余机械臂控制精度高且灵活性好,国内外的在轨组装研究工作大都将冗余机械臂作为核心模块。运动学解算是机械臂运动控制的基础,轨迹规划是实现机械臂精确移动的前提,具备环境适应性的阻抗控制可以使机械臂安全地执行多种在轨任务,这三种技术是在轨组装机械臂的关键技术。但冗余机械臂复杂的运动学和动力学模型为这三种关键技术的实现带来了巨大挑战。智能控制算法以数据为基础,以任务目标为导向,为上述关键技术的实现与优化提供新思路。面向国家对空间智能化的重大需求,针对在轨组装中的运动学求解、机械臂末端轨迹规划和阻抗控制这三项关键技术,开展机械臂智能化研究,为空间智能化提供技术铺垫并积累工程经验。主要研究内容包括:(1)针对运动学逆解数值算法迭代慢的问题,提出了一种基于K-means++聚类和深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)的智能运动学逆解算法。运动学逆解迭代速度与初值和迭代因子相关,初值离目标点越近,迭代速度越快;迭代因子则决定了每一个迭代步的收敛量。首先,针对迭代初值问题,采用K-means++聚类算法将机械臂可达空间点集按照空间距离分类。将逆解目标点所属类的中心点所对应的关节角作为迭代初值,有效降低逆解初值与目标点间的空间距离。实验验证可以减少32.1%的逆解迭代步数和19.5%的逆解解算时间。然后,针对迭代因子问题,采用强化学习方法训练机械臂,使其能在每个迭代步中选取合适的迭代因子,尽可能加速迭代收敛。DDPG算法是一种适用于连续状态空间和连续动作空间内的强化学习方法,能够感知机械臂的运动状态并根据优化策略生成合适的迭代因子,能够解决迭代因子的选择问题。实验验证DDPG算法可以减少28.5%的逆解迭代步数和19.6%的逆解解算时间。最后,将K-means++算法与DDPG算法结合,实验验证最高可以减少42%的逆解迭代步数和25.1%的逆解解算时间。(2)面向组装过程中的自主轨迹规划的需求,提出了一种基于路径积分参数优化(Policy Improvement with Path Integrals,PI2)的动态运动基元(Dynamic Movement Primitives,DMP)轨迹规划算法。DMP可以从示教轨迹中模拟新轨迹,新轨迹形态由DMP中轨迹学习参数决定,对原有轨迹拟合越好,DMP的可控性越高。在DMP中加入人工势场可以令模拟出的轨迹躲避已知形态和位置的障碍物,避障性能由势函数参数决定。显然,DMP的可控性和避障性能互相影响。如何选择最优的轨迹学习参数和势函数参数是重要的高维优化问题。PI2是一种无模型、基于抽样的学习方法,算法除了探索噪声之外不需要调整算法参数,尤其适用于多自由度的高维优化问题。仅需为PI2设定合理的奖励函数,即可同时优化DMP中的轨迹学习参数和势函数参数。仿真和实验表明,在保证避障成功的前提下,PI2优化的DMP较固定参数的DMP,轨迹贴合程度提高了10.4%。基本具备了自主规划轨迹的能力。(3)面向组装过程中机械臂末端柔顺的需求,提出了一种基于孪生延迟DDPG(Twin Delayed Deep Deterministic Policy Gradient,TD3)的阻抗控制算法。组装过程中,机械臂的末端柔顺性可以提高载荷和协作对象的安全性。阻抗控制可以有效实现机械臂对外力的柔顺性。但阻抗控制参数调教复杂且只适用于单一场景。TD3是一种适用于连续状态空间和连续动作空间的深度强化学习算法,它改进了DDPG算法中的不足,在动作空间维度较大的环境下表现更优,因而适用于阻抗控制算法的实现。基于TD3的智能阻抗控制算法可以根据机械臂的运动状态和末端受力自主选择环境适应的阻抗参数。为了体现外力柔顺性,将末端的加加速度设为惩罚函数,加加速度越大,则末端对外力的柔顺性越差。实验验证了基于TD3的阻抗控制算法能够自动调节阻抗控制参数。在与固定参数的阻抗控制算法对比中,末端加加速度范数降低了79.7%。
其他文献
白僵菌(Beauveria)和绿僵菌(Metarhizium)等昆虫病原真菌,是全世界现有真菌杀虫剂和真菌杀螨剂的主要来源,在农林害虫绿色防控中发挥越来越重要的作用。对害虫害螨具有生防潜能的昆虫病原真菌侵入寄主体内后需适应寄主血液微环境,包括pH、高渗透压以及寄主免疫防御产生的氧化胁迫。因此,昆虫病原真菌的杀虫作用依赖于体壁穿透和血腔定殖期间克服寄主免疫反应的能力。本研究试图通过昆虫病原真菌致病性
学位
天文导航系统是一种通过探测天体位置信息确定姿态的导航系统,星敏感器是天文导航系统中精度最高、抗干扰性最强的导航设备。国内星敏感器在空间和近地面夜间任务中得到了广泛的应用,而在近地面白天条件下,较强的天空背景辐射会影响星敏感器的正常工作。随着我国军事实力的不断发展,近地面武器装备对导航系统的测量精度和抗干扰能力提出了更高的要求,使得星敏感器在近地面全天时的应用需求愈发迫切。因此,目前全天时星敏感器是
学位
随着空间望远镜分辨率、集光能力要求的不断提高,光学系统主反射镜的口径越来越大,反射镜组件对重力变化、温度变化、运输发射等环境干扰也变得更加敏感。传统刚性单体镜系统随着口径要求的增大,主镜的制造、加工、检测、运输成本急剧增加,安全风险也不断增大。詹姆斯·韦伯空间望远镜(James Webb Space Telescope,JWST)的成功发射,证明了分块可展开式空间成像系统的可行性,是未来超大口径空
学位
随着航天遥感信息在灾害控制、环境检测、军事领域以及科学研究等应用中的不断深入,遥感卫星技术正经历着前所未有的发展。光学遥感卫星在轨运行过程中,飞轮作为保障卫星姿态控制的重要执行部件,在其正常工作时会产生幅值小、频带宽的扰振力和力矩。这些扰振力和力矩虽然不会造成结构上的破坏,但可能会使敏感光学元件相对位置精度降低,影响成像质量,严重时甚至会使图像模糊、退化、变形。因此,针对飞轮微振动问题开展深入研究
学位
在生物科研领域,大视场高分辨率的光学成像以及定量的相位成像一直是两个重要的研究手段,前者可以使我们看清更微小的细节,将观察的触角伸入到细胞内部,后者定量化了我们对透明样品的观测,使结果更具参考性。傅里叶叠层显微成像术(Fourier ptychographic microscopy,FPM)作为一种全新的计算光学成像方法,不同于传统显微镜“所见即所得”的观测模式,它通过频谱融合的方式可以实现兼具上
学位
近年来,二维范德瓦尔斯(van der Waals)半导体材料,包括过渡金属硫族化合物(Transition metal dichalcogenides,TMDs)的MX2(其中,M=Mo、W;X=S、Se),已逐渐成为新兴的低维量子材料与后摩尔时代重要的候选材料。其单原子层具有与体相材料不同的特性,例如:直接带隙、较大的激子(Exciton)结合能、较强的光与物质相互作用等。更为重要的是,通过控
学位
近年来,环境污染问题日趋严重,雾霾天气出现的越来越频繁,严重地影响了我们日常的生产与生活。在雾霾天气下,光学设备无法获取有效的场景信息,色彩失真严重,图像对比度较低,成像质量较差,对视频监控、自动驾驶、卫星遥感等领域造成了较大的影响和干扰。因此,如何在不丢失图像细节或引入额外干扰信息的前提下,有效地去除图像中的雾霾,最大程度上恢复出图像的细节和纹理信息,提高图像清晰度和饱和度,具有重要的研究意义和
学位
自然界的动植物经过亿万年演化,发展出了多种独特的功能。随着科学技术的发展,人们开始使用各种先进的显微手段对具有超疏水特性的表面进行研究,从认识,了解到模仿自然,研究出了具有超疏水特性的仿生结构和仿生材料。飞秒激光作为近几十年新兴的微纳加工手段,由于其具备加工精度高、材料加工范围广、加工过程中热效应低等特点已经逐步应用于多种精密加工领域。通过飞秒激光在材料表面加工出微纳米结构,随后使用化学修饰使材料
学位
高光谱遥感技术因其光谱分辨率高、可同时反映地物的光谱信息与空间特征等优势,在民用和军事领域得到了广泛应用。目标检测是当前高光谱遥感图像处理与分析领域重要的研究课题之一,异常检测是实现目标检测的主要方式。大部分现有异常目标检测算法均会涉及如矩阵求逆、求解高阶导数和计算协方差矩阵等高阶运算,这使得该类算法在处理大视场高光谱遥感图像时,在高计算复杂度与数据量巨大的双重作用下,难以快速检出异常目标。此外,
学位
自由空间光通信(Free Space Optical Communication,FSO)是一种以激光束为信息载体,以大气作为传输介质的通信方式,由于其容量大、保密性高、抗干扰能力强、频谱资源丰富等优点被广泛关注。为了满足不断增长的数据容量需求,自由空间光通信也正朝着大容量、高速率的方向发展。因此,如何在自由空间光通信系统中实现更大的信道容量、更高的信息速率、更优异的系统性能成为了重要的研究课题。
学位