论文部分内容阅读
在这个信息量飞速膨胀的时代,图像作为一种重要的信息承载形式,关于它的检索技术已成为近年来一个重要的研究方向。传统的基于文本关键字的搜索模式已不能满足用户的需求,而后发展出了基于内容的图像检索(CBIR)这一概念。同时底层视觉特征的提取也取得了一些进展,诸如颜色、纹理、形状等方面的特征提取都出现了多种算法,虽然纹理和形状特征尚未出现比较统一的提取方式,但多种方法也都能从不同方面尽可能保留视觉特征的信息量。一方面是底层视觉特征的技术逐渐趋于成熟,另一方面,数据量的急剧膨胀让单机式的CBIR系统面临巨大挑战。故而分布式计算和CBIR系统的结合势在必行。本文着眼于此,从以下几个方面进行了研究:本文从图像底层视觉特征出发,研究分析了CBIR系统在底层视觉特征方面的适用性和提取方式:(1)颜色特征方面比较了基于RGB模型和基于HSV模型的颜色特征提取,通过实验验证了HSV模型在检索方面的优势;(2)纹理特征方面采用了基于灰度共生矩阵的纹理特征提取,并使用纹理图像和非纹理图像进行了检验,实验表明纹理特征的通用性不强,对非纹理图像进行检索时,结果相对混乱;(3)形状特征方面采用了基于边缘方向直方图的形状特征提取,之后用自然图像对其进行了检验,检索排名比较理想,但是也出现了相似度数值区分度不大的缺点。最后对颜色特征和形状特征进行了综合,使结果能够更全面的反应底层视觉特征带来的影响。对用户而言,检索的准确率和用时是最直观的感受。但是庞大的图像特征库在进行匹配时将是一个非常耗时的过程,考虑到单机式CBIR系统在这方面的不足,为此引入了分布式计算,并利用了代表性的Hadoop系统及其MapReduce编程模型。着重对图像匹配模块进行了MapReduce架构的设计,使得对于时延要求最高的匹配模块能够利用分布式计算带来的高并发性,并通过实验验证了其在检索用时方面相比于传统单机架构的优势。