基于手眼系统的视觉识别算法实时性能研究与提升

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:systemlu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文立足现有的手眼系统架构和视觉识别算法,着眼于对三维物体识别抓取的实时性能,包括:手眼系统单帧识别速度、综合位姿估计成功率、自动观测抓取实验的稳定性。通过对现有识别算法的研究与分析,提出一些改进策略提升手眼系统的实时性能。主要研究内容包括以下四点:(1)基于LINEMOD模板匹配算法,提出一种多面体递归的均匀模板分布策略。该策略用多面体的顶点分布来拟合手眼系统观测空间的相机视点,每一层新视点的产生都是在上一层基础上通过等分三角形的方法来完成。经过仿真比较,在同样的测试场景下,我们提出的均匀分布模板策略在保证识别精确度的基础上,大幅度提升了识别算法的识别成功率。(2)提出区域匹配分层模板搜索策略。我们根据递归模板生成策略的模板分布结构提出区域匹配的分层搜索算法。首先,我们在r维度上进行部分分层搜索;接着,我们建立基于区域分层的模板索引结构,用区域分层搜索策略来简化搜索过程。经过实验比较,运用区域分层搜索策略后,模板库的搜索时间得到极大提升。(3)将视觉识别算法与神经网络分割融合。我们提出将神经网络分割的结果作为模板匹配算法的待识别图像,这样每幅图搜索区域减小,算法的运行速度得到提升。在用人工图像分割的方式验证该思路的可行性后,我们将FCN图像分割与模板匹配算法相融合,将算法的单帧识别速度提升到100ms以内。(4)设计手眼系统识别抓取演示及对比实验。我们在ROS中搭建手眼系统识别抓取的演示实验框架,并且引入Moveit碰撞检测使得手眼系统实时运行更加安全可靠。基于搭建的实验框架,我们将之前未优化的视觉识别算法与优化后的算法在实时场景中进行实验比较。通过我们搭建的实验框架和运用优化策略的视觉算法,手眼系统观测与识别的实时性能得到明显提升。
其他文献
Q 最近学会了用Picasa来管理图片,它的全盘搜索功能可以把电脑上的所有图片都搜索出来,不过有些文件夹里面的图片,既杂乱又不太用得着,其中以QQ图片文件夹为代表。
有句话叫做“覆水难收”,泼出去的水,怎么能够收回呢?很多时候,我们会希望撤回某一封仓促发出的邮件,否则可能会造成不必要的麻烦或误会。不过,如果是通过QQ邮箱向另一个QQ邮箱发送
小猪:你脖子扭来扭去的不累啊? 小狐狸:虽然玩这个游戏不扭脖子也可以,但总感觉扭起来有气氛…… 小猪:啥?你玩的这是什么游戏啊? 小狐狸:就是花哨一点的“大家来找茬”啦!英文直接翻
目的探讨维持性血液透析(maintenance hemodialysis,MHD)患者血清瘦素(Leptin)、脂联素(adiponectin,ADPN)比值(L/A)与颈动脉内中膜厚度进展(progression of carotid int ima
一、强化音节教学对刚入学的儿童来说,整体的音节是具体可感的,声韵母则是抽象的.儿童在不识字或识字很少的情况下,只有掌握了音节,才能进行读写.所以,应在单韵母教学的基础
期刊
作文是许多小学生在学习语文的过程中最头疼的问题,教师在指导小学生们写作文的时候也倍感吃力,以至于小学语文的作文课一度枯燥无味。有一个点亮作文课堂最为有效和直接的方式就是巧用语文教材,挖掘语文教材中与作文教学相关的点,做到语文教材资源的二度开发,有效运用到作文教学当中去。  一、巧用教材。激发思维。衍生写作话题  小学生在写作文的时候,最为基础的就是要找到写作的话题,没有话题写作就无法展开,而写作的
目的:通过非酒精性脂肪性肝病小鼠模型观察负调控信号通路TLR4-TRIF-IFN-β和负调控分子IL-1RA在NAFLD发生发展中的变化,探讨负调控通路TLR4-TRIF-IFNβ和负调控分子IL-1RA在
关于软件的选择,你是否也存在各种疑惑? 如果是,那么“PCD‘PK’台”正是为你量身定制的栏目。我们将针对一些常见应用点,选择几款相关的经典软件进行“PK”,最后根据不同的需求推荐最适合你的软件。今天要与大家见面的,是现在人气最高的视频播放器—《暴风影音》,和来自韩国的新兴播放器——KMPlayer。瞧,它们已经来了……
又完成了一年的班主任工作,我认为与其说我的任务是教育,不如说其实就是和班里的孩子们以合适的方式相处,因为教育能被接受的前提就是和谐相处。通过一年多的摸索,班里大部分
在音箱行业竞争日趋白热化的今天,也许只有注重设计和创新才会做出消费者认可的产品。可喜的是,漫步者的两款产品在今年获得了CES颁发的"设计与创新奖",下面我们先来看看已经