论文部分内容阅读
随着计算机技术、互联网技术的发展,网络中涌现出了海量的图像,如何有效管理和利用这些图像成为了亟待研究的课题。解决该问题的突破口就是数字图像处理技术中的图像自动分类技术。然而,图像自动分类技术一直是困扰图像标注、图像检索发展的学术性难题。目前,在很多的图像分类系统中仍然是利用人工手动分类。由于网络中日益产生大量的图像,利用人工手动分类存在着工作量大而乏味,工作人员眼睛极易疲劳且效率低下,分类结果容易受分类人员主观因素影响而产生语义分歧等问题。因此,图像的自动分类得到了更多的重视。图像自动分类方法利用计算机视觉原理来代替人工进行图像分类,不仅可以提高效率,降低操作人员的劳动强度,而且使得分类结果更为客观。本文对图像的自动分类展开研究,当前在图像分类领域里应用较为广泛的词袋模型是本文分析研究的重点。传统的词袋模型的特征表示方式,在提取SIFT特征时需要构造多尺度的极值空间导致计算复杂,并且对局部区域所提取的特征点数目不够导致描述能力不足。针对以上不足,本文提出一种不需要构造极值空间,而是通过网格直接提取单尺度SIFT特征点并进行特征描述,形成词袋模型的图像分类方法。该方法直接通过网格确定特征点提取位置,不但在提取更多特征点时没有增加计算量,而且注重兼顾局部特征的全局性,使得在形成视觉词典之后,视觉单词之间的类间差别更大,从而更有利于利用svM的分类。通过实验证明单尺度SIFT词袋模型比常规SIFT词袋模型在查全率、查准率、综合指标等三方面都有所提高。由于提出的单尺度SIFT词袋模型的分类效率依然不高,实质还是描述符维度相对较高,影响了描述符检索的效率。进而提出一种基于单尺度提取低维度描述符的方法形成词袋模型。通过实验证明,该方法在查全率、查准率、综合指标等三方面保持了与单尺度SIFT词袋模型效果基本相同,但极大的减少了描述符生成过程中带来的运算复杂度。