论文部分内容阅读
物体分类,其实质就是以计算机的角度识别出图像或者视频中所包含物体的类别,如台灯、椅子等。近年来,由于智能移动设备的大范围普及和网络技术的快速发展,数字图像的数量每天都在爆炸式地增长。面对海量的图像信息,人们希望能够利用计算机技术来快速有效地处理这些数据并从中提炼到有价值的信息,这就促使了物体分类领域的产生。本文是在词袋模型框架的基础上,研究物体分类技术中有效的多特征融合方法。鉴于单一特征在物体类别比较多的情况下,存在着对物体外观特征表达不完整的现象,多特征融合技术逐渐成为一个热门的研究方向,并取得一定成果,但同时还存在诸多的问题,例如:时间空间开销不可避免会增大、单一特征的缺点也有可能会被放大等等。本文的主要研究工作就是如何在提高物体类别识别正确率的同时,有效地解决以上两个问题,具体的工作有以下几个方面:(1)提取图像的尺度不变特征转换(Scale Invariant Feature Transform,SIFT)特征和多尺度的局部二值模式(Local Binary Patterns,LBP)特征。SIFT特征是一种发展较为成熟的多尺度特征,描述的是图像的梯度方向信息,并且对室内物体光照条件比较弱的特性具有较好的解决能力。LBP特征描述的图像的纹理信息,而多尺度LBP特征提取到的图像纹理信息则更为详细。本文采用这两种特征进行融合,可以结合两者各自的优势并相互补充,进而对图像进行更全面的特征描述。(2)本文将词袋模型中词包的概念应用到LBP算法中,提出一种基于词袋模型的LBP特征提取方法,与常用的LBP特征提取方法相比,可以有效地降低图像LBP特征向量的维数,从而降低后续对物体进行分类的计算复杂度。(3)本文提出一种基于SIFT和多尺度LBP的多特征融合方法,与单一特征相比,可以有效提高物体分类的正确率。首先利用SVM分类器对每种特征进行单独预分类,根据预分类结果的大小分配0或1作为各自的权重系数,最后将融合后的综合特征向量送入SVM分类器进行分类,得到最终的分类结果。实验结果表明,本文提出的方法可以有效提高物体分类的正确率。