论文部分内容阅读
随着计算机计算能力的逐渐增强和Internet技术的迅速发展,有越来越多的图像和视频数据被发布到互联网上,涌现了海量的多媒体数据。与传统的结构化数据相比,图像和视频等多媒体数据语义更加丰富。多媒体数据的管理对于传统的数据库管理构成了巨大的挑战;对于多媒体数据的组织,存储和检索成为了亟待解决的问题。基于内容的图像检索(CBIR)[8]希望利用图像的颜色,形状和纹理等视觉特征找到具有相似语义的图像。目前,人们已经针对特征提取,检索方法等CBIR的各个环节提出了多种算法;这些算法的提出对于查找具有相似语义的图像有所帮助;但由于语义鸿沟的存在,CBIR的问题还不能得到彻底解决。允许用户在查询过程中对查询结果进行反馈[20],并根据用户反馈调整查询结果的交互式查询方法是目前比较流行的一种效果较好的CBIR方法。[18]它首先根据用户提供的查询图像训练分类器,然后使用分类器对数据库中的图像分类,并把与查询图像具有相同类标签的图像排序后作为查询结果返回,用户可以对查询结果给予反馈,系统会根据用户的反馈进一步调整查询结果,使其更加准确。查询过程可能包含多轮反馈,直到查询结果令用户满意为止。支持向量机(SVM)[1,11,12]是一种性能优越的分类器,广泛应用于包括文本分类[6],图像检索[4]在内的多个领域。但SVM的运算速度比较慢,难以实现实时SVM图像检索系统,因而需要展开对支持SVM查询的索引的研究。本文在SVM特征空间中引入近邻索引的方法,提出了基于聚类的近邻索引和基于马尔科夫随机游走模型[16,24]的近邻索引两种索引方法。它们的基本思想都是根据特征空间中数据点的近邻关系建立索引结构以支持SVM查询。前者将数据集划分成若干子类,根据子类之间的近邻关系建立索引;查询时通过迭代的子类近邻查询找到一些候选子类,然后再深入考察每个候选子类最终得到查询结果。该方法在保证查询准确率的前提下能够大大提高查询速度,而且索引结构的空间占用很小,具有较好的可扩展性。后者将数据集看成网络图结构,利用马尔科夫随机游走模型计算数据集中各点进行t步游走后可达的点以及到达这些点的概率作为索引;查询时直接查询索引得到候选点,再通过计算各候选点到各支持向量的最短路径加权和来为候选点排序,得到最终查询结果。本文的实验分别在包含约74万幅图像和包含约21000幅图像的数据集上使用上述两种算法实现了图像检索系统。从实验结果可知,本文提出的两种特征空间近邻索引算法,对SVM图像检索的查询速度和准确度都有所提高。