基于Faster-RCNN的物体识别与抓取

来源 :东北大学 | 被引量 : 0次 | 上传用户:ah20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人抓取技术的研究一直是各界的热点问题,由最初的通过机器人示教编程来实现对固定位置及固定种类的工件进行抓取,到后来逐渐通过视觉系统来定位工件。传统的识别与抓取技术尤其是在工业中,主要通过机器视觉方式即通过相机能够获得工件图片之后运用图像处理技术来获得工件的轮廓尺寸,之后再得到工件法线与基准法线的偏转角以此来获得位姿。这种方式需要工件种类及形状固定,如果突然出现异形工件则系统可能会产生错误。而近年来随着深度学习技术的迅猛发展,将深度学习技术应用于机器人的识别抓取中可以大大提高机器人的智能性以及减少维护人员的工作量。在此背景下,本文将图像识别技术与点云技术结合来完成对工件的识别与定位,进而完成识别与抓取任务。本文主要基于Faster-RCNN来完成物体识别,之后通过点云来获得目标物体的位姿。整体思路是首先通过Kinect相机来获取目标物体的彩色图像以及深度图像。之后,彩色图像送入到已经训练完的识别网络中进行物体识别。同时框出物体在图像中范围大小。此时,在深度图像中取出相同位置相同范围大小的深度数据,将此深度数据转化为点云数据并与已标定的相应物体的模型点云进行配准。获得的配准数据即为待抓取物体相对于基准模型点云的位姿信息。将此位姿信息传送给机器人,机器人根据相关数据做出相应的轨迹规划来完成抓取。识别网络模型的训练部分,通过改造ZFNet网络来搭建识别网络。保留ZFNet网络全连接层之前特征提取部分。应用已训练的特征提取参数可以简化训练时间,然后根据自己的数据集来创建两层全连接层。同时,由于Faster-RCNN采用RPN网络来生成提取框。所以,RPN网络也需要通过数据集训练。RPN网络会根据特征提取部分的特征图来输出两组结果,一组用于区分图片中的特征是前景还是背景,另一组结果用于对提取框的回归。整体网络搭建并训练完成之后通过对目标物体进行识别测试,网络综合识别准率可以达到93%。同时选取几类形状与训练集中的物体相似但未在训练集中出现的物体进行网络的泛化能力测试,网络的综合识别率在68.3%。点云配准部分有两部分组成。一部分是基准点云模型的制作,此部分是将待识别物体的模型放在视图中心处进行点云提取并同时制作相应的标签。此时的机器人手臂位置要固定,这样完成基准模型与机器人手臂的绑定。之后是将待抓取物体任意放入相机视窗内的任意位置,通过之前识别部分的结果进行点云提取,然后通过ICP点云配准方法来获得待抓取物体相对于基准模型的位姿信息。机器人抓取部分。通过前两部分的处理得到待抓取物体的位姿信息数据。机器人根据相应的位姿数据来进行轨迹规划从而得到从起始点位置到终止位置点间各个过渡位置点。实现机器人机械臂的精确移动。同时,这部分还需要应用socket通信协议,此协议用于将电脑处理之后位姿数据送给机器人控制器。同时也接收由控制器反馈回给电脑的信息。在识别之后完成抓取的过程中,通过与人工示教的方法进行位置点对比,本研究采用的方法相对于人工示教方法的综合误差范围在2-6mm之间。可以符合工程上的应用。本文提出的基于Faster-RCNN的物体识别与抓取方法。首先识别出工件种类及在图像中的位置,然后在通过运用相应位置的深度数据形成的点云数据来完成配准,获得的位姿信息传送到机器人后完成相应的抓取任务。此方法将识别、定位、运动规划等技术融合来实现目标任务,能够发挥各自的技术优势及特点,增强了系统的鲁棒性及稳定性。
其他文献
语篇教学在小学英语教学中有非常重要的意义,学生可以借助它激起自己的学习兴趣、提高自己获取信息的能力和综合运用语言的能力。学生阅读能力的提升在小学英语学习中尤为重要。现阶段,小学英语阅读教学中仍存在部分问题。基于此,本文对英语教学中语篇教学的重要性,以及在教学过程中的实施步骤和有效教学策略进行阐述。
人口与资源、经济发展和生态环境之间的矛盾已成为中国现代化的最大制约因素。为了保持可持续发展,钢铁工业必须减少对环境的污染,减少二氧化硫排放是钢铁工业减少环境污染的关键环节之一,而钢铁行业里的烧结烟气脱硫是国家酸雨和二氧化硫污染防治重点工程,严格的法律责任,依法防治污染等,将促进钢铁行业污染物的排放标准,控制烟气脱硫势在必行。脱硫自动加水系统改造前,采用的是恒压供水系统,两台水泵一用一备,通过检测供
电梯是集合机械、电气、控制等多种技术为一体的垂直交通工具,随着我国高层建筑的日益增多,电梯的使用量逐年增加,随之而来电梯事故造成人员伤亡的事件也时有发生。本研究应用TRIZ理论思维方法,结合作者在中新软件(上海)有限公司从事的电梯故障分析及电梯设计工作经验,对电梯故障失效模式及原因进行分析,针对性地提出减少电梯故障率的策略。针对存在故障数据的显性电梯故障,本论文采用鱼骨图法对Otis公司2017年
人类对于能源的需求随着全球人口数量增长而不断的增加,但是很多能源无法短时间再生。而且化石燃料过度消耗引起的全球温室效应问题使得人类迫切的寻找新型绿色可再生能源。在这种背景下,风能作为一种新型绿色可再生能源日益受到人们的关注。本文以变速变桨风力发电机组为研究对象。首先在对变速变桨风力发电机组的系统功能结构与控制策略详细分析的基础上,确定了机组主控系统控制策略设计方案,包括转矩控制系统,变桨控制系统以
随着我国经济、贸易、科技等的发展,英语作为通用语在各国的基础教育发展战略中占据突出的地位。作为四项基本技能之一,英语阅读是获取信息和知识学习的重要手段。在高考中,很多学生因为英语阅读能力偏弱导致英语成绩整体偏低。在问卷调查中,不少学生明确表示对英语阅读和阅读课堂不感兴趣。作为知识的表征工具,思维导图已与部分学科实现成功结合,但是关于研究思维导图和英语阅读教学相结合得出的结论却存在显著不一致。本研究
为了模拟托卡马克装置中氢同位素等离子体与第一壁的相互作用过程,自主设计了辉光注入及热脱附实验平台,开展了氘辉光放电对钨样品注入及驻留实验,借助辉光放电光谱仪(GDOES)、四极质谱仪(QMS)等测试手段,分析了氘元素在钨材料样品中的浓度-深度分布规律,得到了氘辉光放电参数对钨材料注入特性及驻留特性的影响规律。论文的主要内容包括:(1)设计构建了辉光注入与热脱附实验平台。为开展钨材料表面辉光放电氘注
国网沈阳电力公司正在加快建设用户屋顶光伏项目,为创造分布式电源接入电网便利条件,缩短并网时间,提高分布式电源建设的效率和效益;确保分布式电源充分利用,促进分布式电源与电网发展的和谐统一。为此,本文研究了分布式光伏系统的结构,由前级升压Boost电路和后级三相逆变电路构成。并且,对光伏电池、Boost变换器和三相逆变器进行数学建模。本文对最大功率跟踪算法的优化、三相逆变器并网控制策略和离并网切换策略
由于近年来国家对东北的政策支持,使得东北区域经济发展迅速。由此导致的电网负载增加以及将大量的非线性冲击负载并入电网,造成系统缺乏无功容量配置和无功补偿调整方法,随着运行方式以及无功功率的影响使得母线电压的变化很大。由此可见,变电站容量优化设计和动态优化控制已经成为目前提高电能质量研究的重点。经济发展对电网的影响就是大量非线性、冲击性负荷的接入,变电站母线电压因缺少无功调节方法而产生很大波动,所以电
仿人机器人是形状和结构上类似于人的机器人,能够模仿人的相似行为,感知世界并做出类似人的反馈。仿人机器人和其他机器人相比,具有较高适应性和智能性,在未来生产生活中会起到不可替代的作用。可稳定行走是仿人机器人实现其他功用,发挥他的特点的前提。人类的双足步行样式在世界上生物圈是相对于其他生物比较完美的,使得生物个体代谢消耗较低。通过采集人体运动数据,观察分析得到人类的行态特点,对仿人机器人进行步态规划和
光子晶体光纤有着许多优异的性能特点,其中高双折射特性能够保持光纤的偏振态稳定,有着良好的发展前景,在近些年来受到了广泛的关注。光子晶体光纤参数可调、结构灵活可变,通过改变空气孔的对称结构和加入不对称因素例如椭圆或者其他材料如金属可以实现高双折射特性,并设计出许多性能良好的新型光纤偏振器件,将其应用到相干光通信、光纤陀螺、光纤传感器、可协调光纤激光器等方面,对工业制造技术以及光通信等领域的发展有着重