论文部分内容阅读
随着多媒体技术以及Internet网络的发展,图像数据迅速膨胀。如何充分利用已有数据使之避免沉没在信息的沼泽里成为急需考虑的问题,这就要准确、快速地查找所需数据。图像检索的发展可分为两代:基于文本的图像检索(text-based image retrieval)和基于内容的图像检索(content-based image retrieval,简称CBIR)。基于内容的图像检索根据视觉内容的相似性进行,避免了基于文本的图像检索人工注解工作量过大、图像信息过于丰富和主观性过强等不足,成为目前的研究热点。广义角度的图像特征包括:①文本特征,如文件名、注解等;②视觉特征,如颜色、纹理、形状等;③语义特征,如图像内容的客观描述或者人观察时的主观感受等。基于文本的图像检索需要人工注解文本特征;基于内容的图像检索则自动提取视觉特征或语义特征。目前大多使用客观的视觉特征,如颜色、纹理、形状等来判断图像之间的相似性。本文针对基于内容的图像检索的关键技术——特征提取进行研究,分析、实现、比较多种典型的检索算法并开发出图像检索原型系统。本文的主要工作如下:1.在研究基于内容的图像检索中各种颜色检索算法以及颜色描述结构的基础上,设计了可伸缩的空间主色法。算法考虑的主要问题是:(1)减少特征数据同时符合人眼视觉特性,得到比较好的检索效果;(2)特征数据和计算量可根据应用及需求进行灵活地调整、伸缩;(3)包含空间信息,改善传统直方图空间信息缺乏的不足。2.通过理论和实验证明,直方图的一阶矩对不同的图像内容不具备区分能力而导致根据一阶矩、二阶矩、三阶矩计算的相似性度量值区分力相对较低;3.对纹理、形状等视觉特征的典型算法进行了研究和分析;4.使用VC 2003和SQL Server 2000设计开发了基于内容的图像检索原型系统,为相关研究提供基础并为后续工作提供可扩展性。本文对基于内容的图像检索进行了初步的研究,评价分析了多种经典的检索算法,提出了自己的见解并设计了可伸缩的空间主色法,开发了实验原型系统,为相关研究工作提供了基础和可扩展性。