基于深度学习的抓取目标姿态检测与定位

来源 :江苏大学 | 被引量 : 0次 | 上传用户:dimitrilyyl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着国家经济和科技的快速发展,社会生产生活与机器人技术相结合的越来越广泛;同时随着基于深度学习的计算机视觉处理算法及计算硬件的快速发展,机器人与深度学习相融合发展的智能型机器人已经成为研究的热点与重点。针对机器人对抓取目标抓取角度检测精度不高与抓取点定位不准确的问题,本研究提出了一种基于卷积神经网络处理机器人视觉信息的二阶段检测方法,实现对抓取目标的快速抓取姿态检测与抓取点精确定位。第一阶段检测利用多抓取目标检测算法,完成对机器人系统输入图片中的抓取目标进行多抓取目标检测,其目的是在多个目标中可以找到待抓取目标,网络输出每个抓取目标的位置和类别,并将待抓取目标的区域特征图输出给下一阶段。对Cornell数据集进行裁剪扩充,依据日常类别将数据集分成20个类,按照Pascal VOC数据标注格式对数据集进行标注。训练端到端的多抓取目标检测模型,算法模型对抓取目标识别的均值平均精度达到83.2%,处理每张图片的耗时少于0.04秒。多抓取目标检测模型输入的多抓取目标图片输出它们的位置和类别,为下一阶段姿态检测与定位缩小检测范围,减少复杂环境背景的影响。第二阶段将第一阶段多抓取目标的输出作为输入,对抓取目标进行姿态检测与抓取点定位。相较之前单一的姿态角度与定位分类或回归模型,本研究方法提出区域姿态检测与定位算法模型,在网络中将抓取目标的姿态角度采用分类的方式输出,抓取点位置坐标采用回归方法输出。对Cornell数据集重新标注抓取角度标签和抓取点,并训练端到端的姿态检测与定位检测模型,然后将第一阶段输出的区域抓取目标输入到训练好的模型中,模型能够对区域抓取目标图像进行姿态检测并预测抓取点位置。模型在实例检测和对象检测测试集上分别取得了96.18%和96.32%的准确率,对于每一幅图像的处理耗时不到0.1秒。模型能够对多抓取目标进行高准确率的姿态角度检测和抓取点定位的同时,在检测的实时性上进一步优化。综上所述,本研究提出的对多抓取目标姿态检测与定位的二阶段检测方法,能够实时的对复杂背景图像中单个或多个抓取目标进行快速准确的姿态检测与定位,并具有很强的鲁棒性和稳定性。
其他文献
高速多体船采用流线型支柱对排水体和主体部分进行连接,不仅具有甲板面积宽敞的优点,并且具有航行阻力小、耐波性好、机动性、运载能力强、横向稳定性好等优势,因而成为各国
便笺式存储器(Scratchpad Memory,SPM)属于片上存储器,它位于cache层并且可以由软件进行控制,但由于传统SPM中的SRAM存在着扩展性差、存储密度小、静态能耗高等问题,严重地影
等同原则是专利侵权司法判定中最常用也是最重要的原则之一,其实质上是对权利要求保护范围的一个合理扩展,认为权利要求的保护范围不仅仅包括字面上的保护范围,还包括与其中
随着互联网和信息技术的快速发展,云计算在越来多越多的行业中发挥着重要的作用,云数据中心的规模变得更加庞大,使数据中心产生了巨大的能源开销,能耗问题变得日益突出。影响
本次翻译实践任务选取《多元视角下的澳大利亚社会》的第六章宗教作为英译汉的翻译材料,这一章主要介绍了澳大利亚人们信仰的宗教范畴,各宗教的教义以及宗教对人们生活的影响
特色小镇是地方政府主动适应和引领经济新常态的战略选择与实践探索,是应对产业发展转型、经济结构优化、增长动力转换而做出的策略选择。特色小镇的创建有力地推动了地方经
赔礼道歉作为一项民事责任承担方式,其法律化标志着我国在社会发展中对于这项传统美德的需求和重视,对于受害人的精神利益弥补和我国信用社会的构建起着关键作用。而由于其适
柱矢量光,是指波阵面上不同位置对应的偏振状态不同的光束。其光场强度是一个轴对称分布的甜甜圈形状,常见的柱矢量光主要包括径向偏振光、角向偏振光和混合态偏振光三种。径
中国的美学理论既博大宏深,又源远流长。“意象”作为独具民族特色的中国古代美学的基本范畴,有其悠久的文化渊源,也在创作中与实践活动相互促进、互为因果。“意象”的发展
甲骨卜辭的發現為殷商史研究注入了新的活力,卜辭中珍貴而豐富的記錄是殷商社會的一個縮影,這批無可替代的原始語言材料成為瞭解那個時代最直接有力的工具。其中,甲骨文字形