基于情景记忆和强化学习的机械臂技能获取

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:ASGSXX1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机械臂对操作技能进行学习是其智能化的重要环节之一,机械臂通过自主学习各种操作技能,实现对不同任务和环境的自适应,可以极大地减少人类的工作量。深度强化学习是机械臂进行操作技能学习的主要方法,但是需要较长的学习训练时间,并且对已有经验的复用不足。情景记忆具有保存不同事件之间的关系的能力,人类可以使用情景记忆来指导新技能的学习。基于上述内容,本文开展基于情景记忆和深度强化学习的机械臂技能学习方法,结合情景记忆的认知特性,提高经验的复用效率,减少学习新技能花费的时间,主要研究内容包括如下若干方面:首先,综合机械臂的感知、运动以及记忆能力构建了基于情景记忆的机械臂操作技能学习框架。以Kinect相机作为机械臂视觉传感器,捕捉外界环境变化信息,实现对外界物体的识别与定位。基于ROS系统下的Move It!等开源机械臂功能包,构建机械臂的基本运动原语集合,实现对低层动作的整理和规划。并且,提出基于事件的情景记忆建模方法,结合人类情景记忆的认知特性与深度强化学习算法的迭代特定,构建具有高效检索能力的情景记忆模型。其次,进行了情景记忆在具有离散空间的强化学习算法中的应用,提出了情景引导的两相强化学习算法。将强化学习的单步迭代过程划分为前后两个相位,针对前相位的动作选择过程,使用情景记忆进行引导,机械臂使用策略生成的动作和记忆中保存的动作进行选择决策。针对后相位的即时奖赏生成过程,由记忆中状态的潜在价值来调整当前状态价值,提高机械臂操作技能学习过程中对稀疏奖励情况的适应性。再次,研究情景记忆在具有连续空间的强化学习算法中的应用。针对连续空间中存在的单维度存在无限种可能状态的问题,提出对状态空间的网格化和归一化算法,实现由连续状态空间到离散网格空间的映射。在此基础上,使用两相情景引导算法进行连续状态和动作空间下的强化学习。考虑到情景状态之间潜在关系,提出应用于HER算法的基于情景构型的奖赏函数,在强化学习算法的早期使用情景状态生成即时奖赏,加快早期的探索过程,大幅提高了HER算法的效率。最后,搭建了基于UR3e机械臂、Kinect相机以及Robotiq夹爪的实验平台,并同步搭建了对应的仿真环境。软件系统的组成包括ROS系、Move It!软件、Pytorch深度学习框架、Mujoco仿真软件等。针对本文所提的离散空间与连续空间两种机械臂操作技能,设计了木块堆叠任务、物体收集任务、机械臂Reach任务与Pick-and-Place任务,以验证本文所提的两相情景引导算法与情景构型的奖赏函数的可行性由高效性。
其他文献
立体微纳结构作为平面结构的重要补充,在微纳传感器、精密光学、组织工程、新能源等领域有着巨大的产业需求。然而,低成本、高效率地制备高长径比的立体线形结构比较困难。电流体喷印技术可以通过稳定的微纳射流实现立体结构的打印,具有打印分辨率高、材料选择范围广、工艺简单等特点,非常适合高长径比立体线形结构的制备。本文首先对热场调控电流体喷印的过程进行了理论分析,通过构建仿真模型,着重研究了墨水粘度对射流的影响
学位
混凝土是建筑工程中的重要材料,但混凝土在腐蚀性环境和冻融环境中易因水的渗入而被腐蚀或破坏,严重影响了混凝土建筑的安全性、耐久性和美观性。使混凝土表面获得超疏水性可防止水的渗透,能有效保护混凝土建筑。但现有超疏水涂料的机械强度较低以及现有超疏水混凝土与保温层的黏合强度较差,导致超疏水表面在建筑领域的应用受到限制。针对以上问题,论文通过在混凝土砂浆中加入聚丙烯酸酯乳液(PAE),研制了一种新型的超疏水
学位
加速度计作为惯性导航系统的核心元件,广泛应用于航空、航天等领域,加速度计精度的高低对导航和制导精度影响很大。为提高加速度计标定精度,离心机测试加速度计时,通过改变加速度计姿态和离心机转速提供多位置,多范围的信号激励,在保证位置精度的同时,得到不同姿态下的输出信号。目前,加速度计多位置测试通常需依赖精密转台实现高精度定位,而不依赖转台的方法精度又较低。本文根据加速度计离心机测试的位置要求,研制出一款
学位
传统的道路监控探头在处理交通事故中需要专业人员手动找到违规人员和肇事车辆,这样不仅效率低下,且因为探头被固定安装带来了机动性差、视野狭窄等问题。将无人机摄像头作为道路监控探头具有体积小、成本低、视野广阔、灵活性高等优点,此外,运用基于视觉的目标检测技术对无人机影像进行智能化分析可以快速且准确的定位地面的行人及车辆,同时大幅度提升监测效率。基于上述背景,本文对行人及车辆目标检测技术展开了研究,并基于
学位
在机械生产加工中,对切削力进行准确测量关乎对于整个切削过程的控制,是智能制造及自动化生产所不可或缺的技术。在众多可以实现切削力测试的测力仪中,压电式测力仪具有良好动态测试性能的突出优点,四维力测力仪能够满足车、磨、刨、铣等大多加工方式的切削力测试,四支点测力仪刚度高,能保证优良的测试精度,因此四维力四支点压电式测力仪得到了广泛应用。随着精加工和多任务加工设备的发展,近年来对于测力仪的测试性能和通用
学位
掩膜电解加工是一种应用广泛的加工技术,在金属微结构的加工中具有独特的优势,如:加工速度快、加工后工件无残余内应力、工具电极无损耗等。在进行常规掩膜电解加工金属微结构时,边缘效应影响下的边缘电场强度高于中心,导致金属微结构的整体尺寸均匀性较差。为了解决这一问题,本文提出了一种移动喷射式掩膜电解加工技术——通过缩小阴极面积使边缘效应减弱,利用移动阴极来平衡电流密度和加工时间,同时通过喷射加工及时排出电
学位
随着新一代航天装备向轻量化和高可靠发展,迫切需求一类大尺寸、超薄壁厚的铝合金球壳。常温拉深成形此类球壳,极易出现起皱和开裂并存缺陷。针对此难题,本文提出铝合金超低温拉深成形技术。该技术采用超低温介质将铝合金板材冷却至具有双增效应的临界温度,通过模具整体成形出薄壁壳体,具有成形极限高、组织性能易控制等系列技术优势。本文以2219铝合金球壳为对象,通过数值模拟和工艺实验方法,研究铝合金在不同超低温温度
学位
作为第三代半导体材料,氮化镓具有许多优异的性能,但应用中除自身性能良好之外,晶片还需要具有纳米级的形状精度以及亚纳米级的表面/亚表面损伤,而氮化镓硬度高、脆性大,加工中极易产生机械损伤。因此,清晰认识其在纳米加工中的微观机理,对优化加工工艺以获得高精度、低损伤的氮化镓晶片至关重要。本文通过分子动力学模拟和纳米压划痕实验,深入研究了氮化镓在纳米划擦中表面及亚表面损伤的形成机理及影响因素,旨在丰富氮化
学位
Nomex蜂窝芯与上下面板粘接形成的蜂窝夹层结构具有高比强度和比刚度等良好的力学性能,被广泛应用于航空、航天等领域。为实现蜂窝芯与面板之间的可靠粘接,控制蜂窝芯的面形误差,实现高面形精度蜂窝芯表面的加工至关重要。蜂窝芯作为一种具有薄壁孔格结构的弱刚度难加工材料,采用高速铣削会出现压溃、撕裂等加工损伤。超声切削作为一种先进的特种加工技术在加工Nomex蜂窝芯时具有切削力小、加工表面质量好等优点。圆片
学位
岸边集装箱起重机是用于装卸集装箱的专用设备,应用广泛。但随着港口装卸朝自动化及智能化方向的不断发展,对集装箱起重机的操控稳定性提出了更高的要求。在常规作业的集装箱入库(吊具与集装箱对接)或出库(集装箱与集卡对接)时,箱体在钢丝绳的柔性及风力等多种因素耦合影响下不可避免的会产生绕箱体竖直方向的扭转运动,从而导致集装箱与吊具或集卡之间往往存在一定的扭转角度偏差。为实现箱体对接需要利用电动推杆调节吊载姿
学位