论文部分内容阅读
随着计算机技术、网络技术的迅猛发展以及图像采集设备的日益普及,图像数据的种类和数量与日俱增,如何从海量的图像数据中快速、准确的检索出满足用户需求的图像成为当前研究的热点。早期的图像检索是基于人为对图像所做出的文字化注释,进行关键词搜索的技术,人为的注释具有不充分、主观、费时费力等缺点,无法满足当前用户的需求。近年来,基于内容的图像检索(Content-Based Image Retrieval,CBIR)技术应运而生。CBIR融合了模式识别技术、图像处理、数据库管理以及计算机视觉等多个学科的相关知识,它的基本原理是:提取图像的颜色、纹理、形状等内容特征构成特征向量描述图像内容,以特征向量间的距离衡量图像间的相似程度,然后按照与查询图像的相似程度排序,将图像库中图像返回给用户。由此可以看出,图像内容特征的选择、提取以及匹配都影响着最终的检索效果。随着对CBIR技术研究的不断深入,各种CBIR算法层出不穷,在对当前流行的一些检索算法进行分析研究之后,文中提出了一种基于内容的图像检索算法FCTL(Fuzzy color、texture and location),它融合了图像的颜色、纹理和空间位置三种内容特征,并在提取颜色特征时结合了模糊数学方面的知识,最终生成一个300柄的特征向量,FCTL采用Matsushita距离计算图像间的相似度。文中用FCTL与常用的一些检索算法,分别在WANG、UCID图像库上进行检索,并选用MPEG-7标准推荐的ANMRR(Average Normalized Modified Retrieval Rank)评价算法对检索效果作评价,实验结果表明,相较于当前常用的一些基于内容的图像检索算法,FCTL的精确度有所提升。当前,CBIR技术大多都是提取图像的低层内容特征来描述图像信息,很少涉及到图像的语义层特征,这可能导致算法对图像内容的描述与用户语义层面的理解有所出入,从而使检索结果不如人意。因此,要保证图像检索系统达到较高的用户满意度,除了采用更精确的检索算法之外,还应该添加相关反馈机制,实现人机互动,通过用户对返回结果的评价,指导系统对用户需求的学习,通过反馈迭代使检索结果不断贴近用户的检索意图。文中提出一种基于查询点移动的相关反馈机制,根据用户的反馈信息,调整图像相似度匹配时每一维特征所占权重,使图像库中相关图像与查询图像越来越相似,而不相关图像则不断远离查询图像。为了便于实验分析,文中构建了一个图像检索系统Image Retrieval,该系统支持FCTL和当前流行的一些图像检索算法,如:基于颜色特征的检索算法FCH(Fuzzy Color Histogram)、基于纹理特征的检索算法EHD(Edge Histogram Descriptor)、结合颜色与纹理特征的检索算法FCTH(Fuzzy Color and Texture Histogram)和CEDD(Color and Edge Directivity Descriptor),Image Retrieval提供了WANG和UCID两大常用检索图像库。为了进一步提高检索效率,系统中添加了相关反馈机制,可根据用户的反馈信息,不断学习用户喜好。