基于模仿学习和强化学习的机械臂运动技能获取

来源 :大连理工大学 | 被引量 : 3次 | 上传用户:supersonic
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类在成长过程中,会经历从老师处学习知识和自主探索获取知识两个阶段。受此启发,模仿学习、强化学习等机器学习方法开始被应用于机器人技能获取。特别是现在结合视觉技术,机器人可以感知丰富的环境状态信息,用于策略学习或者交互探索。根据以上内容,本文开展基于模仿学习和强化学习的机械臂运动技能获取研究,主要包括以下几个方面:首先,基于RGB-D图像能够映射三维空间信息的属性,提出了一种与RGB-D图像交互的机械臂示教方法(RGB-D image interaction demonstration,RGBD-ID),该方法结合智能交互思想并面向任务级示教。Kinect V2作为视觉传感器实现物体识别和定位,基于MoveIt!运动规划软件实现高层动作规划。将RGB-D图像作为示教平台,在图像中与一个物体交互并选择一个高阶动作,引导机械臂在实际工作空间操作对应的物体,多步的交互就组成了一项运动技能的示教轨迹。然后,开展了从示教中学习技能的研究。根据人类技能获取行为和RGBD-ID方法每一步与一个物体和一个动作交互的特点,提出一种由目标物推理网络(Objects list network,OLN)和策略学习网络(Policy learning network,PLN)组成的模仿学习架构(OPLN)。OLN和PLN均由LSTM神经网络构建,其中OLN学习了物体的操作顺序关系,PLN学习了物体的状态属性,从而机器人能够在较高的认知水平上实现自主推理和技能获取。在无人为干预的情况下完成从示教中学习到策略。再次,进行了基于强化学习的机械臂运动技能获取研究,通过与环境交互自主学习策略。针对机器人操作任务,提出一种基于物体构形匹配(Objects configuration matching)的通用的奖赏函数设计方法,根据向量相似性度量方法计算物体目标构形和当前构形的相似性,构建即时奖赏为关于该相似性的函数。以Actor-Critic算法为主体结构搭建了机械臂强化学习模型,结合设计的奖赏函数学习优化技能策略。最后,针对上述方法搭建了相应的实验平台。实验平台的硬件系统包括UR5机械臂、气动二指手抓、Kinect V2深度摄像头等;软件系统由ROS机器人操作系统、MoveIt!运动规划库、Matlab、pytorch神经网络框架等组成。设置了堆叠积木任务和Pick and Place任务,验证了本文RGBD-ID方法、模仿学习模型和强化学习模型用于机械臂获取运动技能的有效性和可行性。
其他文献
针对传统火炮身管直线度检测存在的深膛受限、精度较差、自动化程度较低等不足,设计了一种基于光电位置传感器的适用于不同口径,不同长度身管的火炮身管直线度检测分析系统,由直
水口水电站工程建设部分利用世行贷款,实行国际招标文件经过竞争性投标,评标和6年来的合同实施。本文总结了实践经验,探讨了招标设计工作深度,中外施工企业营,当地劳务和材料供应,施
为了解决车载信息系统测试的机械性重复,提高测试效率,确保测试过程的一致性,将探讨以CANoe集成自动生成的测试脚本的自动化测试系统,利用VTsystem的板卡资源进行测试环境的
对机坪事故运用事故树进行定性分析后,再对引起基本事件的人为失误原因进行分类,最后利用动态灰色关联方法分析这些人为失误因素的影响程度。某机场实例研究得出,该机坪事故的人
目的探讨房颤患者320排容积CT冠状动脉血管成像的图像质量。方法 19例房颤患者行320排容积CT冠状动脉成像,以优、良、差为标准,评价各支冠状动脉的图像分布。同时评价平均心
2010年广东高考数学文科第20题可以说是全卷的“点睛之笔”!让我们借助几何画板从4个方面解读这道题蕴含的丰富思想和独到之处吧!原题已知函数f(x)对任意实数x均有f(x)=kf(x+2),其中
光合有效辐射吸收比率(FPAR)是反映植被生长过程的重要生理参数,是陆地生态系统模型的关键参数,是反映全球气候变化的重要因子。基于遥感的FPAR估算方法是获取区域乃至全球尺度
为了寻找对杨树烂皮病病原菌具有高效抑制作用的木霉菌株,采用对峙培养法和生长速率法对国内外29个木霉菌株进行了筛选,并对筛选出的高效菌株的生理生态特性和分类地位进行了
本论述运用文献资料法、逻辑分析等研究方法,以经济学和管理学视角,对1976~2004年间的七届奥运会的后奥运时期大型体育场馆经营情况进行综合分析;考察北京奥运会后大型运动场
在张掖市沿祁连山冷凉旱作农业区,通过使用不同浓度硼肥,进行旱作油菜叶面喷施,研究对油菜经济性状和产量的效应。试验结果表明:随着硼肥浓度的提高,油菜株高、茎粗、植株开展