论文部分内容阅读
在现代信息社会,图像数据成指数倍增长,对图像数据的应用已经深入到各个领域中。如何快速、高效地对图像数据进行组织、存储、表达和检索是亟待解决的课题。为了准确地表达图像信息,研究者们提出了基于内容的图像检索(Content-based Image Retrieval, CBIR)技术。经过近二十年的研究,该技术逐渐成为图像表达和检索的关键技术。目前国内外对基于内容的图像检索的研究主要集中于两个方面:一是研究如何选择合适的全局特征去描述图像内容和采用什么样的相似性度量方法进行图像匹配;二是基于区域的图像检索方法,主要思想是通过图像分割技术提取图像各区域中物体或对象的特征,然后对每个区域使用局部特征描述,最后综合所有区域的特征进行检索。国内外众多研究表明,颜色直方图不能体现颜色的空间分布,优先颜色只能表示图像中少数几种主要颜色和它们在区域中出现的频率,基于迭代的优先颜色提取方法有计算复杂度高的缺点。当前,基于区域或分割的形状特征提取方法不能准确的表达图像中物体或对象的整体形状,已有的全局形状特征描述方法大都只能描述形状的部分特性,不够细致和准确。为了更好的表示和描述图像的颜色特征,本文在Manjunath B. S.和Jens-Rainer Ohm等人提出的优先颜色描述符(Dominant Color Descriptor, DCD)的基础上,引入图像的颜色距离的概念,给出其计算和表示方法,并深入分析如何使用聚类方法来提取和表示图像中的优先颜色,提出一种基于非参数聚类的优先颜色提取算法。该算法结合了直方图和颜色聚类的优点,既表达了颜色出现的频率,又体现了颜色与颜色之间的视觉相似程度。最后,本文使用引入的颜色距离来计算基于优先颜色的图像的相似度。在形状特征方面,本文以Canny边界检测为基础,提出基于边界点集的曲线获取算法和曲线连接算法。曲线获取算法首先删除边界点集合中的孤立点,再将剩余的边界点集合按照分布情况组织成曲线。曲线连接算法将各曲线尽可能的按照图像对象的轮廓连接起来,得到闭合的形状轮廓。最后,综合颜色和形状两种特征的相似性度量方法,描述了如何计算图像与图像间的相似度。在此基础上,结合颜色特征和形状特征,本文提出基于优先颜色和轮廓逼近的图像检索模型。实验结果表明,本文基于优先颜色的图像检索方法用于检索颜色丰富的图像时能检索出更多相似的图像,基于优先颜色和轮廓逼近的图像检索方法能够得到比已有方法更高的查全率和查准率。