论文部分内容阅读
图像识别技术研究的是试图让计算机拥有类人的智能,从存在干扰、噪声和杂乱的图像环境中辨别或提取有意义的目标和对象及其特征属性的能力。图像识别技术的研究意义重大,在医学、工业、电子商务、通信及军事等领域都得到了广泛应用。图像识别方法从设计的理论基础上大致可以分为三类:一是完全基于图像信息的方法,二是基于目标模型的方法,三是前面两类方法的组合。完全基于图像信息的方法,是依赖图像像素本身的特有性质(例如灰度值、图像直方图、梯度及纹理信息等)来设计算法,这种方法得到的识别结果常常与人对图像的直观认识存在差异;基于模型的图像识别是以对象目标的先验形状模型为依据,从图像中识别和定位具有固定形状的目标对象的有效方法,根据模型是否可变,可分为刚性模型与柔性模型。实际生活中各种对象的外形常常会发生变化,这种情况下,应用模型形状固定不变的刚性模型方法会受到很大限制。许多基于可变弹性模型的方法已被提出,但大多数方法存在的问题是,它们牺牲模型的类别特殊性以适应形状的变化,所以在图像表达的过程中欠缺鲁棒性。ASM模型可以捕捉特定类别对象形状的自然变化,在存在特定结构的图像中搜索,是用于识别外形可变对象的一种鲁棒方法。但传统的ASM方法在进行搜索时盲目地迭代计算图像像素的局部纹理特征以匹配关键点,这是个严重耗时的过程。为了克服以上图像识别方法的不足,学者们将前面两种类型的方法进行组合,提出了组合方法,以得到更好的算法。本文受组合方法思想的启发,结合基于图像信息的边缘检测和基于目标模型的ASM来设计新的图像搜索策略,提出基于边缘窄带的多分辨率主动形状模型(Boundary Neighborhood based Multi-Resolution Framework Active Shape Model,简称BN-MRASM),以试图得到鲁棒性与高效性并存的图像搜索策略。首先,在基于多分辨率框架的ASM方法的基础上,为提高搜索效率,结合了图像的边缘检测算法,且进一步将边缘像素膨胀为边缘窄带以保持算法鲁棒性,最终形成基于边缘窄带的多分辨率主动形状模型方法,BN-MRASM。该方法主要分为三个步骤:一、训练模型,由对象样本集统计出对象平均形状以及形状的变化模式,即对象的点分布模型,并计算训练集中关键点的局部纹理特征;二、搜索初始化,构造新图像的多分辨率框架,使用边缘检测算法得到每一级分辨率图像的边缘,并将其膨胀为边缘窄带;三、图像搜索,结合点分布模型与边缘检测得到的边缘窄带进行多分辨率图像的ASM搜索。实验部分将传统ASM,引进了多分辨率框架的MRASM以及BN-MRASM三种方法在相同数据集上运行,结果显示新方法在没有影响图像搜索精度的情况下,针对高分辨率、低边缘比例图像的搜索执行效率明显高于传统方法。本文主要工作如下:(1)对图像识别方法类型以及较具代表性的图像识别算法进行概述。(2)简要描述了典型的基于图像信息的方法,K均值聚类及其改进算法;详细介绍基于模型的ASM方法的主要思想及其优势,分析它的具体建模和目标搜索实现过程,介绍图像多分辨率框架。(3)指出传统ASM方法存在的不足,并在其基础上加以改进,结合边缘检测算法,使其在效率上得到提高。(4)展示传统方法与改进方法的实验对比结果并对各种方法的搜索结果和执行效率加以分析。