论文部分内容阅读
随着现代社会数字化程度的不断加深,视觉信息以数字图像的形式广泛地充斥在人们的生活当中。图像分类作为图像处理和计算机视觉的重要组成部分,可以对数字图像进行快速准确的分析和管理,帮助用户从中获取所需的视觉信息,它在数字图书馆的建立、医学图像处理和无人驾驶等领域有着广泛的应用。近年来,词袋(Bag of Words,BoW)模型因其简易且行之有效的优点被用于图像分类中,并且逐渐成为图像分类领域的主流技术。因此,本文对基于BoW模型的图像分类方法展开深入研究,并在此基础上,对模型中关键部分进行改进从而提高分类的准确率,主要研究内容如下:
1.针对常规BoW模型仅依赖单一图像特征对图像信息描述欠完备的问题,提出一种基于均匀划分的Laplace谱结构特征提取方法,并结合图像尺度不变特征变换(Scale Invariant Feature Transform,SIFT)构建基于两种特征的、信息描述较完备的视觉词典,经过特征量化,能够更好地对图像空间结构信息进行描述。
2.提出一种基于权值分层K-means聚类的视觉词典构造方法。该方法分别利用Laplace谱结构特征和局部特征先对图像库进行层次聚类,得到基于各个类别图像的子视觉词典;然后对子视觉词典集合进行二次聚类,得到父视觉词典;最后对两种特征的父视觉词典进行权值分配,平衡两种图像特征在图像分类过程中所起的作用,得到最终构建的视觉词典。实验结果表明,应用该方法构建的视觉词典可以更好地概括图像信息,提高了图像分类的准确率。
3.借鉴空间金字塔和多支持区域的思想,构建一种塔式中心对称局部二值模式(Towel Center-Symmetric Local Binary Pattern,TCS—LBP)描述子。在TCS LBP描述子的构建过程中,首先运用最大极值稳定区域(Maximally StableExtremal Regions,MSER)检测算法提取图像不变特征区域;其次,对检测的特征区域进行尺度和仿射的规范化处理;然后在特征空间上引进金字塔式区域划分,计算划分后各个子区域的中心对称局部二值模式(Center-Symmetric LocalBinary Pattern,CS_ LBP)值;最后将各子区域的计算结果按照一定规则进行组合,得到新的图像局部特征即TCS_ LBP。图像分类的实验结果表明,构建的描述子具有较好的鉴别力,能够进一步提高图像分类的准确率。
4.针对BoW模型中传统空间金字塔匹配(Spatial Pyramid Matching,SPM)策略在图像特征汇聚时的不足,提出一种多适应空间金字塔匹配(Multi-adaptation Spatial Pyramid Matching,Ma-SPM)策略,该策略在图像空间上引进更精细的多分辨率、多层次划分方法,在保留图像表达细节描述能力的同时,加强了图像特征空间序的整体性与完备性。在BoW模型中,将新构建的TCS_ LBP描述子作为图像的特征,并利用Ma-SPM策略对图像特征进行量化,最后将得到图像的视觉直方图表示代入分类器完成图像分类任务。实验结果表明该方法具有较高的分类准确率。
1.针对常规BoW模型仅依赖单一图像特征对图像信息描述欠完备的问题,提出一种基于均匀划分的Laplace谱结构特征提取方法,并结合图像尺度不变特征变换(Scale Invariant Feature Transform,SIFT)构建基于两种特征的、信息描述较完备的视觉词典,经过特征量化,能够更好地对图像空间结构信息进行描述。
2.提出一种基于权值分层K-means聚类的视觉词典构造方法。该方法分别利用Laplace谱结构特征和局部特征先对图像库进行层次聚类,得到基于各个类别图像的子视觉词典;然后对子视觉词典集合进行二次聚类,得到父视觉词典;最后对两种特征的父视觉词典进行权值分配,平衡两种图像特征在图像分类过程中所起的作用,得到最终构建的视觉词典。实验结果表明,应用该方法构建的视觉词典可以更好地概括图像信息,提高了图像分类的准确率。
3.借鉴空间金字塔和多支持区域的思想,构建一种塔式中心对称局部二值模式(Towel Center-Symmetric Local Binary Pattern,TCS—LBP)描述子。在TCS LBP描述子的构建过程中,首先运用最大极值稳定区域(Maximally StableExtremal Regions,MSER)检测算法提取图像不变特征区域;其次,对检测的特征区域进行尺度和仿射的规范化处理;然后在特征空间上引进金字塔式区域划分,计算划分后各个子区域的中心对称局部二值模式(Center-Symmetric LocalBinary Pattern,CS_ LBP)值;最后将各子区域的计算结果按照一定规则进行组合,得到新的图像局部特征即TCS_ LBP。图像分类的实验结果表明,构建的描述子具有较好的鉴别力,能够进一步提高图像分类的准确率。
4.针对BoW模型中传统空间金字塔匹配(Spatial Pyramid Matching,SPM)策略在图像特征汇聚时的不足,提出一种多适应空间金字塔匹配(Multi-adaptation Spatial Pyramid Matching,Ma-SPM)策略,该策略在图像空间上引进更精细的多分辨率、多层次划分方法,在保留图像表达细节描述能力的同时,加强了图像特征空间序的整体性与完备性。在BoW模型中,将新构建的TCS_ LBP描述子作为图像的特征,并利用Ma-SPM策略对图像特征进行量化,最后将得到图像的视觉直方图表示代入分类器完成图像分类任务。实验结果表明该方法具有较高的分类准确率。