论文部分内容阅读
具有物体识别能力是智能机器几基本的感知功能之一。机器几在感知物体存在并确定其位姿的情况下才能实现抓取、跟踪等任务。形状信息是一种高层视觉特征,通过形状信息特征可以让机器几实现对物体的理解,包括形状和姿态理解。如何让机器几将形状信息从自然图像中抽象并表示出来,是计算机视觉的一个核心。目前自然图像边缘检测和分割仍难以达到理想效果,关于形状的研究也局限于在分割好的形状模型上展开形状分析斤的研究。关于纯形状的分析斤研究取得了大量成果,但是受噪声、形状建模等因素影响,很少能直接直用于实际中。本文对面向机器几直用的物体形状识别和姿态估计进行研究。机器几通过视觉传感器感知环境中物体信息,提取稳定形状特征表征物体,采用机器学习方法,实现物体形状识别和姿态估计。论文主要就形状表述、相似度度量,基于形状信息的二维和三维目标识别以及三维物体姿态问题进行研究。首先,论文分析斤了纯形状特征研究现状,对全局特征描述和局部特征描述进行了探讨,全局特征描述方法对遮挡和噪声敏感,局部特征方法容易出现误匹配,提出了一种结合全局和局部特征信息的形状匹配方法,该方法在基于全局特征优化对齐的基础上,采用多种信息描述的方法实现形状相似度计算。提出的形状匹配算法在计算效率上有较大的优越性,并在MPEG7数据库及KIMIA数据上取得了很好的结果。其次,对自然图像物体识别方面存在的困难的挑战进行了探讨,利用形状特征信息实现物体识别的难点在于自然图像中物体难以用参数化方程表示,且图像边缘轮廓提取受背景噪声、视点变化等因素的影响不能获取稳定的边缘轮廓。基于目前不成熟的形状理论,难以实现自然图像中物体的识别。针对上述问题,提出了一种利用形状片段特征的物体识别方法,提出的形状片段描述方法具有比例、旋转不变性,且对点噪声不敏感。综合提出形状片段描述子、形状片段匹配及Hough变换等方法,用自上而下的框架进行物体识别,在ETHz数据库及实际采集图像上具有很好的效果。然后,分析斤了传统三维物体建模方法,同类三维物体难以建立统一的三维模型,较复杂形状物体建模易受视点、形变等因素影响,三维物体建模可以采用多视图方法实现。在对各种描述特征分析斤及多视几何研究的基础上,论文提出了一种基于多视图学习的混合模板模型方法实现三维物体检测。该方法采用点集和片段集特征,利用视点间的几何关系,并结合视点插值方法实现三维物体模型构建。在斯坦福数据库及采集视频上验证了提出算法的优越性。最后,对三维物体姿态估计问题进行了分分斤,姿态估计主要受匹配精度、噪声、优化求解算法等因素影响。论文提出了一种利用形状片段匹配的三维物体姿态估计方法,该方法利用单幅图像可以实现三维物体姿态估计,推导出的方程符合svlvester方程形式,采用优化求解方法可以实现高精度的姿态估计。本文以形状信息为主线,研究内容涵盖了物体识别和姿态估计的几个关键问题,并在这些方面取得了一些理论成果,已经得到了大量的实验证明。本文所提出的理论、模型及算法对面向机器几的机器视觉理论及直用也有指导意义。