论文部分内容阅读
图像的分类与识别是人工智能领域和计算机视觉领域中一个重要的研究课题,现阶段国内外关于图像分类与识别的研究正蓬勃发展,其中应用广泛的领域有:人脸检测、场景识别、光学字符识别、基于内容的图像检索、目标的监测、视觉定位、目标跟踪和视频去抖动等。然而由于图像中的物体一般情况下存在有遮挡、旋转、变形、对比度不一致等问题,如何有效地构建高效的图像描述子就越来越成为该领域内研究者们关注的重点,本文从图像的底层特征和结构化信息出发,提出了基于图像底层特征及其结构化信息和稀疏编码的图像描述子的构建方法,从而在线性SVM作为分类器的情况下达到对图像有效的分类与识别。在SIFT特征、Bandelet特征和稀疏编码的基础上,本论文就如何利用图像的底层特征构建高效的图像描述子做了大量的工作,主要涉及图像底层特征的提取、图像局部结构化信息和全局结构化信息的捕获方法、稀疏编码方法等等。本文主要工作如下:1)提出了一种基于SIFT特征和稀疏编码的级联空间最大化池的图像分类方法。即在SIFT特征的稀疏编码的基础上运用空间金字塔最大化池方法一层一层地构建图像的描述子。首先在SIFT特征的基础上运用空间最大化池方法,在整合并优化原始SIFT特征的同时,空间金字塔模型捕获了图像局部的结构化信息;其次对整幅图像块的稀疏编码再运用空间最大化池方法,即可以整合局部图像特征并且捕获图像全局的结构化信息,从而构建出图像的描述,再利用线性SVM训练学习并进行图像分类。2)提出了基于SIFT特征的级联匹配追踪的图像分类方法。即先提取出图像的SIFT特征,从局部小图像块的SIFT特征出发,利用级联匹配追踪一层一层地构建图像的描述,最后利用线性SVM训练学习并用于图像分类,该方法是一个基于SIFT特征的深度学习模型。3)提出了一种基于Bandelet特征的空间金字塔最大化池的图像分类方法。即利用Bandelet能较好地捕获图像中几何流的特性以及Bandelet变换系数的稀疏性,在Bandelet特征的基础上,利用几何流向信息与空间金字塔最大化池方法构建图像的描述子,从而用线性SVM训练学习并用于图像分类,该方法有效地降低了图像描述子的维数。