基于内容的图像检索方法研究现状

来源 :吉林画报·教育百家 | 被引量 : 0次 | 上传用户:poiuytrewq444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘 要】本文对基于内容的图像检索方法做了较详细的总结,其中主要讨论了空间域图像检索算法,基于颜色、形状、纹理、频率域的图像检索算法,进行研究比较。
  【关键词】图像检索方法;颜色图像检索算法、形状图像检索算法、纹理图像检索算法、频率域的图像检索算法
  一、引言
  为了解决基于文本关键字的图像检索存在的问题,基于内容的图像检索方法成为图像检索的研究热点。基于内容的图像检索方法就是在将图像存入图像库的同时,自动提取反映该图像内容的特征向量,并存入与图像库相连的特征库。在进行图像检索时,对每一幅给定的查询图像自动提取该图像的特征向量,通过将该图像特征向量与特征库中的特征向量进行匹配,并根据匹配结果到图像库中搜索,就可提取出与所查询图像最相似的图像。
  二、空间域图像检索算法
  随着基于内容图像检索算法为人们所逐渐重视,空间(像素)域图像检索算法被广泛研究。所谓空间域图像检索是指直接在数字图像矩阵上提取图像特征,对图像进行相似性匹配,提取特征为颜色,形状和纹理信息。
  2.1基于颜色的图像检索方法
  颜色具有一定的稳定性,是图像最直观而明显的特征,因此成为检索中最常用的视觉特征。基于颜色的图像特征一般采用直方图来描述,其算法基本上都是以颜色直方图相交算法为基础而设计。用色彩特征进行图像检索可以追溯到Swain和Ballard提出的色彩直方图的方法。主要可以分为两类:全局色彩特征索引和局部色彩特征索引。
  1、全局色彩特征索引
  全局色彩特征索引方法目前采用最多的是色彩直方图的方法。Pass等人提出以图像的色彩聚合矢量CCV来作为图像的索引,它是图像直方图的一种演变。Stricker和Orengo提出了累计色彩直方图方法,并提出了色彩矩的方法,认为色彩信息集中在图像色彩的低阶矩中。他们对每种色彩分量的一阶、二阶和三阶矩进行统计。Rickman和Stonham提出了色彩元组直方图的方法,将一幅图像中的所有色彩用一些色彩元组来表示,这些色彩元组特征形成了一个特征编码簿,然后对一幅图像中特定位置的n个采样点所对应的色彩元组的特征值在特征编码簿中出现概率进行统计,就形成了一个色彩元组的直方图。
  2、局部色彩特征索引
  由于全局色彩特征索引捕获了整幅图像色彩分布的信息,丢失了许多局部的色彩空间信息。目前从划分局部区域的角度来说可分为:基于固定块的图像分割、基于手工的区域分割、采用交互的半自动的区域分割以及一些自动的色彩分割方法。局部区域中的色彩信息可以表示为平均色彩、主色彩、色彩直方图和二进制色彩集。
  2.2基于形状的图像检索算法
  基于形状特征的检索方法可分为基于轮廓和基于区域两大类。前者将图像进行分割并经过边缘提取后,得到目标图像的轮廓线,针对这种轮廓线进行的形状特征检索。后者直接针对图形寻找适当的矢量特征用于检索算法。但处理这种结构化检索更为复杂,需做更多的预处理。对于每一类方法,根据提取的形状特征来源于图像整体或者是部分区域,又可分为全局和结构两类。
  1、基于轮廓的图像检索方法
  基于轮廓的检索算法只利用了图像的边缘信息。根据图像轮廓的连续性将此类方法分为连续(全局)和离散(结构)两大类。连续性算法不会将图像分为子区域,描述图像形状的特征向量从整个边缘提取。相似性通常定义成在某个度量空间的两个特征向量的距离。离散性算法将形状边缘分为若干段,特征一般采用字符串或者图(树)的形势表示。对于这种算法的相似性度量一般采用字符串匹配或图匹配的方法。
  2、基于区域的图像检索算法
  在基于区域的检索算法中,所有在形状区域内部的像素点都被用来表示形状,基于区域的全局检索方法包括:利用矩特征来描述形状,比较常用的矩特征有Zernike矩和HU不变矩组。其他一些特征还包括形状矩阵,网格等;基于区域的结构局检索方法包括凸壳等。
  2.3基于纹理的图像检索方法
  Tamura概括了6个与人的视觉相关的纹理特征,分别为:粗糙度(Coarseness)、对比度(Contrast)、方向性(Directionality)、线相似性(Line likeness)、规则性(Regularity)和粗略度(Roughness)。但由于是对整幅图像进行处理,效果较差,改进方法是采用直方图。现在,绝大部分基于纹理的图像检索是在小波域下对图像进行检索。
  三、频率域图像检索方法
  在频率域图像检索技术中,DFT、KLT、DCT由于计算量太大,实际应用中很难达到用户要求,而小波以其良好的时频局部性及与人眼视觉特性相符的多分辨率分析能力,一经出现就被广泛用于图像压缩领域,从而促使小波变换在JPEG2000和MPEG中获得应用。目前小波域图像检索技术已得到多方面的研究。
  3.1常用方法简介
  第一类方法被统称为小波直方图法,是DWT域的典型算法之一,不但对纹理图像具有较好的检索效果,而且对于自然图像也很有效。其中Smith等人提出了基于小波系数的纹理识别算法。在该方法中,首先对图像进行三级小波分解,得到9个高频子带小波系数的幅度值。过上采样操作可将幅度系数值通恢复到与原图像相同的尺寸,其中位置相同的点组合起来,可组成一个9维矢量,对于M×N大小的图像,将得到M×N个9维矢量,从而构建一个512级统计直方图作为纹理特征来支持图像的检索。
  第二类方法是子带能量法。这種方法的基本思路是通过对原始图像做小波分解,计算分解后每个子带的能量形成多的维特征矢量,将之用于检索。该类方法最早是由Chang等人提出的基于非规则树分解的纹理分析方法,在该方法中,用于纹理匹配的特征矢量通过计算子带系数的能量形成,纹理分类结果较好。Lee等在文献中为了在降低计算复杂度的同时取得很好的分类结果,仅仅选择包分解子带中能量较大的7个子带形成特征矢量,降低了小波包分解时能量特征矢量的维数。近年来,很多研究者通过选取不同的小波基(正交基、双正交基)、不同的小波分解方法(塔式小波分解、小波包分解等) 以及不同的子带能量计算法等对这种方法进行了深入研究。
  3.2频率域图像检索方法优缺点
  当观察图像时,通常看到的是相连接的纹理与灰度级相似的区域,如果物体的尺寸很小或对比度不高,通常采用叫高分辨率观察;如果物体的尺寸很大或对比度很强,只需要较低的分辨率。如果一幅图像中物体尺寸有大有小或对比有强有弱的时候,以若干分辨率对他们进行研究将具有优势。但是具有如下缺点:
  很多研究者采用小波变换进行图像检索研究,但他们采用的大多是一般的经典单小波方法,已有的优化方法的运算也还是依赖于傅立叶变换,计算复杂度高,资源消耗大,对于即时在线的查找有很大不利。如何优化经典小波变换运算,减少计算量是我们要研究的第一个问题。
  在图像采集过程中,将不可避免的受到噪声干扰,采用传统小波变换,由于消失矩固定,导致这些噪声在图像中产生的很多细微突变,可能会被误认为是图像本身细节,分解后的子带图像不能很好的表征原图像特性。
  图像检索技术虽然已经历经较长时间的研究,综合国内外研究成果,还没找到一个统一公认的能够作为图像唯一标志的特征,当然这也与图像相似性的复杂性有关。图像的相似性不仅指几何变换的不变性,还包括视觉变换的不变性,如何找到一个特征能较好描述图像,使检索结果具有上述两种不变性。
  参考文献:
  [1]李向阳,庄越挺,潘云鹤。《基于内容的图像检索技术综述》计算机研究与发展 2001,3
  [2]田玉敏,林高全。《基于颜色特征的彩色图像检索方法》西安电子科技大学学报2000,9
其他文献
摘要:钢铁工业是我国工业结构的重要组成部分,但也是能源消耗最大的部分。钢铁工业的发展,带动了我国经济的发展,同时能源消费总量越来越大。国内的钢铁企业要在资源逐渐减少的情况下得到生存和发展,就必须走节能和减少能源成本的道路,本文就钢铁企业如何有效地降低能耗和减少能源的成本展开论述。  关键词:钢铁工业;降低能耗;能源成本  中图分类号:F416.31 文献标识码:A 文章编号:1001-828X(2
摘要:市场经济下商业银行的竞争愈加激烈,要想赢得客户,需要有一套科学全面的营销策略。本研究以建设银行吉林分行为案例,在充分调查建设银行市场营销现状的基础上,提出了产品策略、促销策略和渠道策略,以期提高建设银行吉林分行的营销质量,丰富我国商业银行营销策略。  关键词:建设银行;服务营销;营销组合策略  中图分类号:F830.33 文献标识码:A 文章编号:1001-828X(2013)05-0-01
积留量法是一种应用于在线有功调度的有效方法,但积留量法仅考虑全系统发电可调容量与负荷变化陡峻程度之间的关系,未注意系统内各子区域的发电可调容量与负荷变化陡峻程度之
摘要:货币政策工具不但调节货币供应量和银行资本充足率,也影响社会需求量。我国实施什么样的具体货币政策必然影响商业银行信贷投向,因此商业银行要借力目前我国稳健的货币政策合理调整银行信贷结构。  关键词:货币政策;调整;商业银行;信贷结构  中图分类号:F830.33 文献标识码:A 文章编号:1001-828X(2013)05-0-01  2013年3月温家宝总理在《政府工作报告》中强调:要继续实施
摘要:现阶段我国的经济呈现出稳步下行的现象,并且市场的流动从整体上也是相对紧凑,以及一般存款分流等因素的影响,我国的商业银行在上半年存款增长相对缓慢,并且市场竞争也日益激烈。在这种利率市场下,我国的银行业,尤其是商业银行,需要进行一定的战略转变,进而更好地适应社会变化。  关键词:商业银行;转型;利率市场化;战略  中图分类号:F830.33 文献标识码:A 文章编号:1001-828X(2013
摘要:中小企业是推动国民经济发展的重要组成部分,也是大型企业的前身。国家的发展需要中小企业的不断创造和成长,然而中小企业由于规模小缺乏竞争力和在成长过程中的不确定性和不稳定性,在发展的过程中经常会受到诸多阻碍,尤其是融资问题,一直是困扰众多中小企业的大难题。通过正规金融机构融资虽然是中小型企业首选渠道,但由于自身的不足和银行信贷紧缩及偏好的原因,中小企业通过正规的金融机构融资通常会遭受重重阻碍。因
[摘要]水是生命之源,水利是农业的命脉,是国民经济的血脉,随着农田水利工程建设问题的不断突出,小型农田水利工程重点县建设也越来越得到了重视与推广应用,文章着重分析了目前师宗县小型农田水利的概况,针对小型农田水利工程重点县建设存在的一些问题,提出小型农田水利重点县建设,并对其可行性进行分析。  [关键词] 农田水利 建设 问题  [中图分类号] TV93 [文献码] B [文章编号] 1000-40
摘 要 随着高等教育的发展,导师在学生作品中署名的现象日益常见。但究竟导师在学生作品中签字在法律上该如何定性目前急具争议性。本文从实例出发,结合相关法理,对此提出笔者观点。  关键词 署名 著作权 意思自治  2012年5月,河南省高级人民法院公布了《河南法院知识产权保护十大典型案件》,其中1件涉及高校学生学位论文著作权归属的案件引人关注。最终法院判决学生学位论文的著作权应归学生个人所有。近年来,
摘要:本文总结了对过度自信投资者行为分析的两种模型,H
摘要:随着经济的发展和人们投资意识的转变,股票投资已成为人们生活中的重要组成部分,股票价格的变化也成为投资者关心的重点。股票市场非常复杂,影响股价变化的因素很多,而神经网络算法刚好对复杂的非线性模型的预测有着很好的效果。论文利用基于Clementine的神经网络模型对A股市场非常有代表性的上证综合指数进行分析预测,旨在对股民的投资决策起到指导作用。  关键词:神经网络;上证综合指数;Clement