论文部分内容阅读
当前,图像分类已成为计算机视觉与模式识别领域的重要研究内容,在实际情况中也有着十分广泛的应用。图像分类方法通过提取图像的关键特征,对图像进行自动识别与理解,为很多现实问题提供了有效的解决方案。视觉特征的提取与表达是图像分类算法中最基础也是最关键的环节,有效的特征表达方法能够减轻对后续机器学习算法的依赖性,同时也制约着整个分类系统的性能表现。图像中存在丰富的空间关系信息,对这些空间关系信息的刻画能够有效地跨越或缩小底层视觉特征与高层语义之间的“语义鸿沟”,对于提升图像分类的性能具有重要的意义。目前已有不少研究工作关注图像的空间关系信息描述,在一些医疗影像等特殊的应用背景下,图像特征基元之间的空间关系可能会异常复杂,细节空间关系可能和语义直接关联,失之毫厘谬以千里。现有相关研究中对空间关系的刻画难以满足上述需要。针对此,本文围绕图像的空间关系信息进行细致化的描述,基于这些细节空间关系信息对图像进行有效的特征表达,进一步提升图像分类精度,并结合医学、场景、遥感等多个领域数据展开研究。本文的主要工作和贡献总结如下:(1)提出了一种新的拓扑关系模型DTString。现有大多数空间关系模型表示较为简单,基本关系数目有限,丢失了大量的空间关系细节信息,与视觉特征表达的实际需求仍然存在一定的差距。本文提出的DTString模型基于字符串描述的方法,实现了对图像区域之间拓扑关系细节的精细刻画。本文证明了DTString是一种原子拓扑关系模型,即DTString所描述的拓扑关系是不可再分的拓扑关系,具有完备的拓扑关系表达能力,我们称DTString为精细拓扑关系模型。此外,本文还提出基于DTString模型的推理算法,这些推理算法使得逆关系、子区域等拓扑属性可以由DTString字符串直接推理获得,而不需要繁复的几何计算,为后续高效的相似性度量提供了基础。(2)提出了基于精细拓扑关系的图像分类方法。在精细拓扑关系模型DTString的基础上,我们首先研究了完全匹配、镜像匹配、部分匹配等多种匹配模式,提出了基于拓扑关系的相似性度量方法,并应用于几何结构检索。接着,以精细拓扑关系表达方法为基础,在基于局部特征的图像分类框架中研究了子区域的正规网格和超像素两种采样方式,进而提出了基于DTString和混合子区域采样的图像分类算法。几何结构检索和场景图像分类的两组实验结果表明,所提出的DTString模型及相应的相似性度量方法能够有效地刻画图像特征基元的细节空间关系信息,并进一步提升视觉特征的判别能力。(3)针对纹理基元的局部细节空间关系进行研究,提出了面向医学图像分类的纹理描述方法SAHLBP。现有纹理描述方法主要刻画了图像反复出现的局部模式,但是忽略了局部模式之间的细节空间关系信息。这些局部细节空间关系信息,对于区分复杂的、尤其注重细节的数据,比如医学图像,具有重要的意义。针对此,本文以局部二值模式方法为基础,对纹理基元的局部细节空间关系进行刻画。首先提出一种自适应邻域半径搜索算法确定纹理基元,进而提出一种邻近空间直方图策略来刻画纹理基元的局部细节空间关系,由此产生新的SAHLBP纹理描述方法。与现有方法相比,SAHLBP具有两个显著优点:一是能够有效地刻画纹理基元之间的局部空间关联信息,具有更强的纹理描述性能;二是具有尺度不变性,即对尺度和分辨率变化不敏感。最后,本文将所提出的基于SAHLBP的图像分类框架应用于医学图像分类,在四个真实的医学数据集中获得优异的实验结果,并验证了不同参数、不同分类器和不同分类框架对医学图像分类性能的影响。(4)针对局部特征之间的空间关系进行研究,提出一种新的空间视觉编码方法。现有方法主要通过建立固定的空间结构模板或者划分空间象限,统计落入模板中的局部特征作为空间关系特征,存在特征表达方式简单、判别力不足等问题。针对此,本文在视觉词袋模型中考虑局部特征的方向、共生、距离等多种空间关系,对视觉特征进行有效的空间编码,并通过学习的方式挖掘深层的空间关系模式。首先基于距离和频繁度定义了相关关键点的选择方法,进而提出一种新的结构特征来刻画相关关键点的空间关系模式和类别属性信息,并学习一种结构词袋模型作为一种图像中间层特征,实现了图像的结构化特征表达。最后,提出结合表观视觉特征和结构化特征的图像统一表示方法,在自然场景、运动事件、遥感等四个图像数据集中验证了所提出方法的优异性能。综上所述,本文主要对图像不同特征基元之间空间关系信息的特征表达进行了深入研究,提出了相应的算法。实验结果表明对图像的空间关系信息进行细致化的表达,可以有效地增强视觉特征的判别能力,从而进一步提升图像分类的性能。