论文部分内容阅读
近代,伴随着科技的迅猛发展,计算机普遍具有高速运算和海量存储的特点,这使得数字图像的广泛应用成为可能。在互联网普及的今天,图像数量呈爆炸式增长,为了有效的组织、管理图像,计算机需要准确的理解分析图像的内容,而后对图像分门别类进行管理。图像分类是横跨模式识别、机器学习和机器视觉领域的一个综合性课题,是计算机根据图像所具有的特征来区分一组图像的技术,它大力推动了图像应用的发展。全局特征关注的是一整幅图像所具有的规律,如方差和颜色直方图等,容易被外界条件破坏。目前,通常采用提取图像的局部特征来表征一副图像,相较于全局特征,它具有更好的稳定性和差异性,可以有效识别图像的前景和背景,能有效利用特征点的稳定性和邻域信息更好的表示一副图像,从而提升图像分类的效果。对图像进行特征提取是图像分类的基础工作,这也是图像分类整体中的一个重要环节,选择不同的方法直接影响到图像分类的效果。本文主要研究从一幅图像中提取局部特征的方法,用以提升局部特征在图像分类中对图片的表征能力,从而达到更高的分类精度。重点研究了Harris、CSS、SIFT、MSER、Harris-Laplace、Hessian-Laplace等特征检测算子,并对这些方法的优势及不足进行了分析,并把检测的特征描述为特征向量,结合BOW(Bag ofWords)模型进行表示,最终用于图像分类。本文主要研究内容如下:1.对于当前基于图像内容的图像分类领域的研究进行比较全面的综述,并对研究现状进行了简要的说明,展望了基于内容的图像分类技术的应用前景,主要介绍了几种提取图像局部特征的方法,并分析了各个方法存在的不足之处,为下一个阶段的研究奠定了基础。2.本文通过在检测过程中引入图像的边缘信息改进MSER使其克服边缘敏感的问题。最大稳定极值区域MSER(Maximally Stable Extremal Regions)由于其具有良好的仿射不变性和稳定性而被普遍用来检测图像的区域特征,它可以检测到图像上的块状结构和具有自由形状的区域,然而,MSER对噪声比较敏感,容易把一些不必要的像素引进检测到的区域中,这会直接影响到区域检测的稳定性和定位的准确性,因此,本文通过在检测过程中引入图像的边缘信息来解决上述存在的问题。我们首先对图像使用Canny算子检测边缘,再利用膨胀操作擦除二值化后的不规则区域。实验表明,该方法可以有效克服原MSER算子所存在的不足,且仍能很好的表征图像。3.图像提取的特征需要描述为特征向量才可以用于分类,采用什么样的描述方法会直接影响最后分类结果。本文针对目前广泛使用的尺度不变特征变换SIFT(Scale-Invariant Feature Transform)算子进行分析,并使用SIFT对改进的特征区域检测方法进行描述,说明其对图像分类结果产生的影响。4.本文将改进的局部区域特征检测算子运用于图像分类框架中,并与视觉词袋模型BOW(Bag of Words)相结合,基于把一幅图像抽象成是多个视觉单词集合的思想进行图像分类,实验部分分别使用了场景数据库和行为数据库进行验证,较于传统的BOW模型在分类结果上有所提高,并把改进的MSER与多个检测方法进行横向对比,整体分类效果有所改善。