论文部分内容阅读
随着高科技的发展,图像为人们记录了越来越多的信息,这些信息涉及到工作、生活等方方面面,图像识别因此逐渐成为人们在模式识别领域中所重点关注的方向。基于图特征的图像识别方法作为图像识别方向中的一类有效而常用的方法,被众多学者所研究从而得到了长足的发展。针对现有的该类方法对于存在非刚性变换的图结构难以充分描述这一问题,在综述研究现状及介绍相关技术的基础上,提出了三种不同的描述图结构及相应的距离度量方法,致力于更加准确地进行图像的识别工作。本文所做的相关工作大致如下:(1)对目前已有的基于图特征的图像识别方法进行了综述,介绍了该方向的研究现状。基于图特征的图像识别可以划分成两个关键步骤,一个是图特征的提取和描述,另一个是图特征的距离计算。分别从这两个方面介绍了现有的方法及存在的问题。(2)具体阐述了边缘方向直方图方法、推土机距离方法、形状上下文描述子、词袋技术及K均值算法。这些知识都是与之后章节相关的理论基础,正是基于这些方法,提出了三种新的基于图特征的图像识别方法。(3)提出了基于图的几何统计特征的图像识别方法。在该方法中,首先提取特征点并构建图结构;然后分别计算图结构的边缘方向直方图和边缘距离直方图,以形成图的几何统计特征描述子;最后采用快速鲁棒的推土机距离方法进行图的几何统计特征描述子之间的距离度量,从而得到图像之间的相似性。该方法相比于传统的边缘方向直方图方法,扩展了描述的内容,从不同方向上边缘长度和相对于中心点的平均距离两个方面入手,更加全面地描述了图结构的特征。(4)提出了基于图的结构上下文的图像识别方法。在该方法中,首先提取特征点并构建图结构,获得图结构的采样点集;然后以采样点集的平均坐标作为中心,计算采样点相对该中心的极坐标,通过统计采样点的分布得到图的结构上下文描述子;最后使用改进的推土机距离方法进行图的结构上下文描述子之间的距离度量,从而得到图像之间的相似性,以进一步进行图像的识别工作。该方法结合了形状上下文方法的思想,使用二维直方图来描述图结构,相比于传统方法,可以更加充分地体现图结构的特征。(5)提出了基于图的词袋上下文的图像识别方法。在该方法中,首先提取特征点并构建图结构,获得图结构的采样点集;然后分别计算每个采样点的熵值上下文,形成码书,将这些码书中的单词通过K均值算法,得到K个不同的聚类中心;接着计算图结构相对于聚类中心的特征向量,形成图的词袋上下文描述子,用于表征图结构的信息;最后使用曼哈顿距离的计算方法,进行该描述子之间的距离度量,从而得到图像之间的相似性,以进一步进行图像的识别工作。该方法将文档检索中词袋技术与图的熵值上下文相结合,相比于传统方法,可以更加有效地描述图结构的特征。三种新的图像识别方法分别从不同的方面进一步完善了图结构的描述方法及距离计算方法,检索与聚类实验结果验证了新方法优于传统方法,表明新方法能够更充分地利用图结构的信息。具有一定结构特征的图像可以使用这些方法进行识别操作。