论文部分内容阅读
在信息量迅速增长的21世纪,信息的有效检索是一个热点问题。在图像检索领域里,在传统的基于关键字的图像检索越来越不能满足人们对信息有效的获取的情况下,基于图像内容检索(CBIR,Content-Based Image Retrieval)系统应运而生,CBIR是在提取图像的颜色、形状、纹理等视觉特征后,采用一定的方法对这些特征进行比较,从而判断图像之间的相关度,查找出最符合的图像。在此系统内的图像标识方式是图像特征属性描述,检索线索是一目了然的图像示例,输入为图像示例,输出为所有与示例特征相同或相近的图像,按相似程度排列,供用户选择,从而把在传统图像检索技术中一般用户难以完成的图像特征描述、提取与识别等难题,交给系统去解决。这项技术现在已经在小范围内有了一定的使用,比如图书馆数字查询系统等,而离技术普及还有许多问题需要解决。本文首先介绍了基于图像内容查询技术的发展现状,然后对数字图像处理的基础进行了说明,在此基础上,介绍了文章所采用的图像的二值化算法-Otsu算法。接着,文章通过介绍图像的颜色、形状、纹理和空间特征的提取,图像相似度的度量方法,特征向量的内部和外部归一化,以及图像查询的评测标准,提出了一种基于颜色、形状和空间特征的综合特征检索方法,其中颜色特征的提取采用HIS颜色空间进行,形状特征的提取是在图像二值化基础上采用的不变矩方法,空间特征的提取是按照一定比例把图像分成九个矩形部分,然后对处于不同位置的矩形赋给不同的权重。而综合特征的计算是在对颜色和形状特征向量进行归一化后,加权求和得到。为了解决上层的语义和低层的视觉特征的差别,文章引入了相关反馈技术,在对它进行介绍之后,对基于修改查询向量的反馈方法进行了改进,提出一种结合数据库技术和聚类方法的相关反馈,使得相关反馈具备一定的记忆功能。在对系统响应时间的提高上,本文对颜色向量进行了聚类,采用聚类的中心作为数据库的索引,使得系统的查询时间大为减少,其中聚类采用的为K-mean算法,最佳聚类数的选择是采用DB Index准则自动进行。最后本文开发了一个基于图像内容检索的原型系统,对以上提出的方法进行了实验,实验表明文章提出的方法具有可行性和较好的实用性。