基于深度强化学习的机械臂密集堆叠物体智能抓取研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:plm0plm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机械臂抓取物体是目前智能机器人研究的重点方向之一,比较常见的是在结构化的空间中,代替人类完成简单重复的抓取工作。随着深度学习(Deep Learning,DL)的发展,机械臂可以在非结构化空间中抓取物体,但是需要事先人为的对目标物体的特征进行标定,训练大量有关模型的数据集,抓取对象是特定的物体,缺少一定的泛化性。随着深度强化学习(Deep Reinforcement Learning,DRL)近几年被越来越多的学者应用到机器人控制方面,能够在非结构化环境下自主的进行学习训练,获得了不错的效果。本文基于深度强化学习的控制算法,研究机械臂在非模型的环境下对密集堆叠物体的智能化抓取,论文的主要工作如下:首先,本文研究并提出了一种基于深度Q网络(Deep Q-Learning Network,DQN)的机械臂控制策略算法,将抓取过程建模为马尔科夫决策过程,在密集物体环境下通过自监督的方式训练抓取的动作。针对在密集堆叠物体环境下,设计了一种模块化的推动和抓取策略,通过对当前物体的分布状态识别检测,判断是否存在独立的物体,若存在执行抓取动作,否则通过推动堆叠物体,改变其分布状态,使环境中重新出现独立的物体。以此反复,从而提高机械臂在密集堆叠物体环境下的抓取效率。其次,对采用的DQN算法进行优化,在训练前期使用高斯模型,提高机械臂探索环境的能力,以便获得最优的抓取位置;设计基于Sumtree的数据结构来存储样本,实现对样本的加权采样,提高机械臂训练的效率;选用Radam优化算法对神经网络中的参数迭代更新。最后,在V-REP仿真平台上进行实验验证,其结果表明,在密集堆叠物体环境下,优化后的DQN算法比传统的DQN算法收敛速度提高了约25%,抓取目标物体的成功率稳定在90%左右。在基于推动和抓取相结合的方法下,与单一的抓取方法相比较,达到平均抓取成功率的速度提高了33.3%,能够更快速的完成对密集堆叠物体的抓取任务,具有一定的实用性。
其他文献
目的:浅析婴幼儿急性喘息性支气管炎应用注射用甲泼尼龙琥珀酸钠的疗效。方法:纳入本单位收治的68例急性喘息性支气管炎患儿作为研究样本,采用随机数字表法分组,其中34例为甲组,采用常规药物治疗;余下34例为乙组,加用注射用甲泼尼龙琥珀酸钠;对比组间的最终疗效、炎症因子变化水平、症状体征消失时间、住院时间及不良反应差异差异。结果:乙组疗效总优良率(94.12%)高于甲组(73.53%),喘憋、咳嗽、湿啰
期刊
随着信息技术和先进制造技术的深入发展,生产过程的数据采集、信息交互与数据分析技术为轴承制造业向智能制造发展奠定了基础。同时随着市场需求日益多样化,智能制造成为轴承企业快速响应市场需求和实现高质量发展的必经之路。轴承智能生产线作为轴承智能制造的重要组成部分,为了更好地适应个性化需求,轴承柔性智能生产线成为主要发展趋势。然而,由于生产线设备配置缺少有效方法,无法动态适应柔性生产需求,造成生产刚性强、效
学位
随着中国先进工业的迅速发展,精密滚动轴承作为重要基本零件,在航空航天、机器人关节、精密医疗器械等方面需求量不断增加。疲劳和磨损是滚动轴承的主要损坏形式,而且大多出现在表层。滚动轴承失效会直接影响整个装备的服役性能和安全,如果发生故障,很可能会造成灾难性的事故。超声滚挤压强化工艺作为一项新兴的无切屑表面近净成形技术,能有效提高轴承套圈表层力学性能。在超声滚挤压加工过程中,合理选取工艺参数对试验结果有
学位
在工业生产快速发展的大背景下,机械臂成为了不可或缺的生产工具,对其应用环境和要求也越来越严格。其中如何实现快速规划安全避障路径,是机械臂运动控制领域的一个技术性难题。现阶段,大部分工业生产中机械臂还是通过人工示教法来实现路径规划,该方法不仅操作复杂,效率低下,而且无法保证机械臂的位姿精度,存在极大的安全隐患。常见的方法还有人工势场法、快速随机搜索树算法(RRT)、概率路线图法(PRM)等等,这些算
学位
与传统驱动器相比,压电元件优点主要体现在结构紧凑、不需要传动机构、不易受电磁干扰、空间占比小、响应速度快、推重比大、环境兼容性强等方面,常被应用在微驱动系统中。目前关于压电元件的研究,大多集中在基体材料、表面电极、控制策略、技术应用等方面。由于压电元件的驱动性能离不开结构合理的表面电极,而表面电极作为压电元件的重要组成部分,既是极化电极也是工作电极,其结构布局与制备工艺是否合理将直接影响压电元件的
学位
机床主轴轴承作为机床主轴系统的重要零部件,其运行状态直接影响机床的工作情况。主轴轴承一旦出现故障,轻则造成设备停机影响生产效率,严重的会造成设备损坏甚至影响工作人员的生命安全。本文以角接触球轴承7005C为主要研究对象,该轴承常应用于磨床和精雕机等机床的电主轴上,准确评估其运行状态,识别轴承的故障形式,及时检修可以有效预防由于主轴轴承失效造成的设备故障,保证设备安全可靠运行。本论文针对机床主轴轴承
学位
四足机器人在跟随过程中会遇到很多突发情况,为提高跟随系统的性能,需很多外部传感器对周围环境进行检测,以使跟随过程更加准确、顺利。本研究以四足机器人为研究对象,搭建了基于多模态信息融合的目标跟随系统,重点研究跟随过程中多模态信息的采集和融合处理。首先,搭建四足机器人目标跟随系统。在综合分析目标跟随系统总体设计要求的基础上,针对目标跟随系统的需求合理地选择了检测周围环境的传感器,并对传感器在四足机器人
学位
马铃薯是优质的粮食作物和经济作物,在内蒙古阴山地区,马铃薯与其他农作物相比更加适应本地气象条件,播种面积占比较大。马铃薯的块茎产量主要是受地上生物量(源)和地下块茎干物质(库)平衡的影响,区域尺度上地上生物量的估算可以为作物产量的监测与预测提供依据。本研究以阴山沿麓地区马铃薯高光谱数据为基础,确定马铃薯地上生物量和块茎干物质积累的关系,利用出版和优化光谱指数、随机森林模型和偏最小二乘法建立卓资山地
学位
大型重点装备在先进制造业中占有重要的地位,其制造技术水平高、知识技术密集,涉及多学科、多领域的交叉技术。传动系统是大型重点装备的关键部件,特大型直齿锥齿轮又是传动系统的核心零部件。特大型锥齿轮具有结构尺寸大、设备依赖度高、制齿难度大等特点,其制造能力是先进制造业核心竞争力的集中体现。因此,对特大型直齿锥齿轮的加工方法研究具有重要的意义。为了解决其体积大难以加工、加工成本高的问题,本文提出采用剖分的
学位
随着科技的发展,自动驾驶车辆、巡检机器人、工业机器人等也快速发展,环境感知已经成为机器人实现其智能化及自动驾驶技术中最关键的一部分。本文通过研究基于摄像头及激光雷达在道路、室内环境中的目标检测、识别及建图,实现机器人环境感知。本文的主要研究内容如下:1)基于YOLOv4-M模型进行视觉图像的目标检测识别研究。针对传统的目标检测算法检测精度低、时间效率慢的情况,本文研究了YOLOv4-M目标检测算法
学位