基于BoW模型的图像分类方法研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:sjuser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会数字化程度的不断加深,视觉信息以数字图像的形式广泛地充斥在人们的生活当中。图像分类作为图像处理和计算机视觉的重要组成部分,可以对数字图像进行快速准确的分析和管理,帮助用户从中获取所需的视觉信息,它在数字图书馆的建立、医学图像处理和无人驾驶等领域有着广泛的应用。近年来,词袋(Bag of Words,BoW)模型因其简易且行之有效的优点被用于图像分类中,并且逐渐成为图像分类领域的主流技术。因此,本文对基于BoW模型的图像分类方法展开深入研究,并在此基础上,对模型中关键部分进行改进从而提高分类的准确率,主要研究内容如下:
  1.针对常规BoW模型仅依赖单一图像特征对图像信息描述欠完备的问题,提出一种基于均匀划分的Laplace谱结构特征提取方法,并结合图像尺度不变特征变换(Scale Invariant Feature Transform,SIFT)构建基于两种特征的、信息描述较完备的视觉词典,经过特征量化,能够更好地对图像空间结构信息进行描述。
  2.提出一种基于权值分层K-means聚类的视觉词典构造方法。该方法分别利用Laplace谱结构特征和局部特征先对图像库进行层次聚类,得到基于各个类别图像的子视觉词典;然后对子视觉词典集合进行二次聚类,得到父视觉词典;最后对两种特征的父视觉词典进行权值分配,平衡两种图像特征在图像分类过程中所起的作用,得到最终构建的视觉词典。实验结果表明,应用该方法构建的视觉词典可以更好地概括图像信息,提高了图像分类的准确率。
  3.借鉴空间金字塔和多支持区域的思想,构建一种塔式中心对称局部二值模式(Towel Center-Symmetric Local Binary Pattern,TCS—LBP)描述子。在TCS LBP描述子的构建过程中,首先运用最大极值稳定区域(Maximally StableExtremal Regions,MSER)检测算法提取图像不变特征区域;其次,对检测的特征区域进行尺度和仿射的规范化处理;然后在特征空间上引进金字塔式区域划分,计算划分后各个子区域的中心对称局部二值模式(Center-Symmetric LocalBinary Pattern,CS_ LBP)值;最后将各子区域的计算结果按照一定规则进行组合,得到新的图像局部特征即TCS_ LBP。图像分类的实验结果表明,构建的描述子具有较好的鉴别力,能够进一步提高图像分类的准确率。
  4.针对BoW模型中传统空间金字塔匹配(Spatial Pyramid Matching,SPM)策略在图像特征汇聚时的不足,提出一种多适应空间金字塔匹配(Multi-adaptation Spatial Pyramid Matching,Ma-SPM)策略,该策略在图像空间上引进更精细的多分辨率、多层次划分方法,在保留图像表达细节描述能力的同时,加强了图像特征空间序的整体性与完备性。在BoW模型中,将新构建的TCS_ LBP描述子作为图像的特征,并利用Ma-SPM策略对图像特征进行量化,最后将得到图像的视觉直方图表示代入分类器完成图像分类任务。实验结果表明该方法具有较高的分类准确率。
其他文献
期刊
期刊
期刊
期刊
期刊
期刊
期刊
会议
随着数字技术、多媒体和计算机网络的飞速发展,人们通过借助各种通信网络可以轻松地访问并获取数字视频等多媒体数据,因此导致一些不法分子对数字视频进行任意的篡改、盗版和传播,从而给版权所有者的合法权益造成严重损失。数字视频水印技术的提出和应用,有效的保护了数字视频的版权问题,已成为近年来国内外学者研究的热点领域。  本文主要以原始视频序列作为研究对象,结合奇异值分解和频域变换的优势,设计了两种抵抗多种攻
期刊