基于深度强化学习的机器人推-抓操作技能学习研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:sansyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推-抓操作技能学习是机器人处理物体抓取任务的基础,已有推-抓操作技能学习方法抓取单物体时往往未考虑物体形状和环境先验知识以及在多物体混合分布时存在抓取困难。为此本文研究了基于深度强化学习的推-抓操作技能学习,针对面向单物体的抓取任务和面向多物体的抓取任务分别设计了两套推-抓操作技能学习方法,基于RGB-D传感器和UR5机械臂搭建了机器人推-抓操作技能深度强化学习系统以验证所提方法的有效性。针对机器人在处理单物体抓取任务时未考虑物体形状和环境先验知识而导致抓取成功率低的问题,研究了引入物体形状和环境先验知识的推-抓操作技能深度强化学习方法。为了将物体形状和环境先验知识用于制定针对性的抓取策略,提出了改进回报模块的DQN决策模型以实现推-抓序列操作学习。该模型通过一个SVM分类器将物体形状和环境先验知识引入到回报模块之中,在训练过程中可以不断激励决策模型学习到期望的操作策略。实际环境中的实验结果表明,该方法对立方体类物体的抓取成功率高达90%,将圆柱体类物体推到约束边界附近以方便侧抓的成功率达到了75%。针对多物体混杂情形下的推-抓操作技能学习方法存在抓取困难的问题,研究了改进的多物体推-抓序列操作技能学习方法。为了避免推-抓操作技能结合的多物体抓取方法在不适合抓取的情形下执行抓取操作,引入不可抓取判断模块对不适合抓取的情形进行预判,根据判断结果决定继续执行抓取操作或者改执行推操作。考虑到推操作有时仅仅将多物体整体推动而不是推开,实施了回报设置改进以激励用于学习推操作技能的DQN决策模型做出推操作决策将多物体推散开且不至于推出工作空间之外。改进后的方法有效提高了多物体抓取的效率。根据以上推-抓操作技能深度强化学习方法的研究,搭建了机器人推-抓操作技能深度强化学习系统,开发了特征提取、运动决策和运动规划三大模块,验证了本文所提方法的可行性和有效性。
其他文献
学位
近年来,校园欺凌呈现出比较严重的趋势,引起了社会各界的广泛关注,如何治理成为讨论的焦点。校园欺凌的发生地点已经不仅仅局限于初中高中,小学校园中也出现了不同程度的欺凌行为,这严重损害了小学生正常的生活学习秩序,危害了小学生的健康成长与发展。如果不及时采取治理措施,长此以往会产生极为严重的影响。因此,研究目前小学校园欺凌治理存在的问题,并提出完善的解决、治理对策,就显得特别的重要。本文主要运用文献分析
近年来我国“校园贷”之风局部盛行,因校园贷引发的暴力催款、学生自杀等恶性事件频发,引起社会高度关注。2016-2017年,我国针对校园贷出台了相关管理规定,禁止未经银行业监管部门批准设立的机构提供校园贷服务,校园贷发展趋势得以减缓,然而2017下半年以来,校园贷事件仍时有曝出,多种形式校园贷变相发生,屡禁不止,校园贷治理仍任重道远。论文以我国校园贷发展现况为研究立足点,采用文献分析、社会调查等研究
重大土木工程结构如大跨桥梁、超高层建筑、大型水利工程等基础设施结构是确保我国经济可持续发展的物质基础,这些结构的健康情况与安全性能是我国人民的生命与财产安全的重要保障。因此,研究如何对现役大型结构进行快速检测与长期监测一直是国内外的研究热点。三维激光扫描技术(3D Laser Scanning)是继GPS技术之后的又一项新兴测绘技术,已经成为获取空间三维数据信息的一个重要手段。三维扫描技术作为一种
滚珠丝杠副具有传动效率高、可逆性、传动精度高、使用寿命长等特点,已成为机床直线进给系统中的重要执行机构。轴向刚度是含滚珠丝杠副的机床直线进给系统的重要使用性能,轴向刚度的建模计算是一个重要的研究话题。传统的进给系统轴向刚度计算模型是基于赫兹点接触理论建立的,仅计入了丝杠-螺母副、轴承接触区和丝杠轴的弹性变形,实际上在丝杠-螺母副、滚动轴承的赫兹接触区外与滚动轴承安装件同样存在着弹性变形,也会降低进
本文以喜剧性戏剧小品的艺术特征及表演技巧为出发点,简述了喜剧性戏剧小品的发展历程,并剖析了不同时期的作品和风格,进而概述出喜剧性戏剧小品的变化和发展;结合当下的时代背景,根据大量实例初探了新时代喜剧性戏剧小品的艺术特征,并从“理、情、味、趣、噱”五个方面试论了喜剧性戏剧小品的表演技巧;针对当下喜剧性戏剧小品的现状及未来的发展趋势,对喜剧性戏剧小品表演发展进行了概括且给出具有一定可行性的提升措施。
学位
冷轧管具有表面平整、圆滑等优点,广泛应用于工业生产、社会生活的许多领域。冷轧管机在管坯轧制的过程中,时常出现设备故障情况,不仅影响产品质量和产量,还会造成设备损坏。所以,对冷轧管机的运行状态进行监控、管理具有重要意义。在已有冷轧管机监控管理系统的基础上,本文提出在系统中增加现场管理器、采用CAN总线实现现场数据通信,并设计开发新的监控管理系统,进而提高系统安全性和可靠性,为冷轧管生产提供更好的技术
学位
学位