论文部分内容阅读
【摘 要】本文对基于内容的图像检索方法做了较详细的总结,其中主要讨论了空间域图像检索算法,基于颜色、形状、纹理、频率域的图像检索算法,进行研究比较。
【关键词】图像检索方法;颜色图像检索算法、形状图像检索算法、纹理图像检索算法、频率域的图像检索算法
一、引言
为了解决基于文本关键字的图像检索存在的问题,基于内容的图像检索方法成为图像检索的研究热点。基于内容的图像检索方法就是在将图像存入图像库的同时,自动提取反映该图像内容的特征向量,并存入与图像库相连的特征库。在进行图像检索时,对每一幅给定的查询图像自动提取该图像的特征向量,通过将该图像特征向量与特征库中的特征向量进行匹配,并根据匹配结果到图像库中搜索,就可提取出与所查询图像最相似的图像。
二、空间域图像检索算法
随着基于内容图像检索算法为人们所逐渐重视,空间(像素)域图像检索算法被广泛研究。所谓空间域图像检索是指直接在数字图像矩阵上提取图像特征,对图像进行相似性匹配,提取特征为颜色,形状和纹理信息。
2.1基于颜色的图像检索方法
颜色具有一定的稳定性,是图像最直观而明显的特征,因此成为检索中最常用的视觉特征。基于颜色的图像特征一般采用直方图来描述,其算法基本上都是以颜色直方图相交算法为基础而设计。用色彩特征进行图像检索可以追溯到Swain和Ballard提出的色彩直方图的方法。主要可以分为两类:全局色彩特征索引和局部色彩特征索引。
1、全局色彩特征索引
全局色彩特征索引方法目前采用最多的是色彩直方图的方法。Pass等人提出以图像的色彩聚合矢量CCV来作为图像的索引,它是图像直方图的一种演变。Stricker和Orengo提出了累计色彩直方图方法,并提出了色彩矩的方法,认为色彩信息集中在图像色彩的低阶矩中。他们对每种色彩分量的一阶、二阶和三阶矩进行统计。Rickman和Stonham提出了色彩元组直方图的方法,将一幅图像中的所有色彩用一些色彩元组来表示,这些色彩元组特征形成了一个特征编码簿,然后对一幅图像中特定位置的n个采样点所对应的色彩元组的特征值在特征编码簿中出现概率进行统计,就形成了一个色彩元组的直方图。
2、局部色彩特征索引
由于全局色彩特征索引捕获了整幅图像色彩分布的信息,丢失了许多局部的色彩空间信息。目前从划分局部区域的角度来说可分为:基于固定块的图像分割、基于手工的区域分割、采用交互的半自动的区域分割以及一些自动的色彩分割方法。局部区域中的色彩信息可以表示为平均色彩、主色彩、色彩直方图和二进制色彩集。
2.2基于形状的图像检索算法
基于形状特征的检索方法可分为基于轮廓和基于区域两大类。前者将图像进行分割并经过边缘提取后,得到目标图像的轮廓线,针对这种轮廓线进行的形状特征检索。后者直接针对图形寻找适当的矢量特征用于检索算法。但处理这种结构化检索更为复杂,需做更多的预处理。对于每一类方法,根据提取的形状特征来源于图像整体或者是部分区域,又可分为全局和结构两类。
1、基于轮廓的图像检索方法
基于轮廓的检索算法只利用了图像的边缘信息。根据图像轮廓的连续性将此类方法分为连续(全局)和离散(结构)两大类。连续性算法不会将图像分为子区域,描述图像形状的特征向量从整个边缘提取。相似性通常定义成在某个度量空间的两个特征向量的距离。离散性算法将形状边缘分为若干段,特征一般采用字符串或者图(树)的形势表示。对于这种算法的相似性度量一般采用字符串匹配或图匹配的方法。
2、基于区域的图像检索算法
在基于区域的检索算法中,所有在形状区域内部的像素点都被用来表示形状,基于区域的全局检索方法包括:利用矩特征来描述形状,比较常用的矩特征有Zernike矩和HU不变矩组。其他一些特征还包括形状矩阵,网格等;基于区域的结构局检索方法包括凸壳等。
2.3基于纹理的图像检索方法
Tamura概括了6个与人的视觉相关的纹理特征,分别为:粗糙度(Coarseness)、对比度(Contrast)、方向性(Directionality)、线相似性(Line likeness)、规则性(Regularity)和粗略度(Roughness)。但由于是对整幅图像进行处理,效果较差,改进方法是采用直方图。现在,绝大部分基于纹理的图像检索是在小波域下对图像进行检索。
三、频率域图像检索方法
在频率域图像检索技术中,DFT、KLT、DCT由于计算量太大,实际应用中很难达到用户要求,而小波以其良好的时频局部性及与人眼视觉特性相符的多分辨率分析能力,一经出现就被广泛用于图像压缩领域,从而促使小波变换在JPEG2000和MPEG中获得应用。目前小波域图像检索技术已得到多方面的研究。
3.1常用方法简介
第一类方法被统称为小波直方图法,是DWT域的典型算法之一,不但对纹理图像具有较好的检索效果,而且对于自然图像也很有效。其中Smith等人提出了基于小波系数的纹理识别算法。在该方法中,首先对图像进行三级小波分解,得到9个高频子带小波系数的幅度值。过上采样操作可将幅度系数值通恢复到与原图像相同的尺寸,其中位置相同的点组合起来,可组成一个9维矢量,对于M×N大小的图像,将得到M×N个9维矢量,从而构建一个512级统计直方图作为纹理特征来支持图像的检索。
第二类方法是子带能量法。这種方法的基本思路是通过对原始图像做小波分解,计算分解后每个子带的能量形成多的维特征矢量,将之用于检索。该类方法最早是由Chang等人提出的基于非规则树分解的纹理分析方法,在该方法中,用于纹理匹配的特征矢量通过计算子带系数的能量形成,纹理分类结果较好。Lee等在文献中为了在降低计算复杂度的同时取得很好的分类结果,仅仅选择包分解子带中能量较大的7个子带形成特征矢量,降低了小波包分解时能量特征矢量的维数。近年来,很多研究者通过选取不同的小波基(正交基、双正交基)、不同的小波分解方法(塔式小波分解、小波包分解等) 以及不同的子带能量计算法等对这种方法进行了深入研究。
3.2频率域图像检索方法优缺点
当观察图像时,通常看到的是相连接的纹理与灰度级相似的区域,如果物体的尺寸很小或对比度不高,通常采用叫高分辨率观察;如果物体的尺寸很大或对比度很强,只需要较低的分辨率。如果一幅图像中物体尺寸有大有小或对比有强有弱的时候,以若干分辨率对他们进行研究将具有优势。但是具有如下缺点:
很多研究者采用小波变换进行图像检索研究,但他们采用的大多是一般的经典单小波方法,已有的优化方法的运算也还是依赖于傅立叶变换,计算复杂度高,资源消耗大,对于即时在线的查找有很大不利。如何优化经典小波变换运算,减少计算量是我们要研究的第一个问题。
在图像采集过程中,将不可避免的受到噪声干扰,采用传统小波变换,由于消失矩固定,导致这些噪声在图像中产生的很多细微突变,可能会被误认为是图像本身细节,分解后的子带图像不能很好的表征原图像特性。
图像检索技术虽然已经历经较长时间的研究,综合国内外研究成果,还没找到一个统一公认的能够作为图像唯一标志的特征,当然这也与图像相似性的复杂性有关。图像的相似性不仅指几何变换的不变性,还包括视觉变换的不变性,如何找到一个特征能较好描述图像,使检索结果具有上述两种不变性。
参考文献:
[1]李向阳,庄越挺,潘云鹤。《基于内容的图像检索技术综述》计算机研究与发展 2001,3
[2]田玉敏,林高全。《基于颜色特征的彩色图像检索方法》西安电子科技大学学报2000,9
【关键词】图像检索方法;颜色图像检索算法、形状图像检索算法、纹理图像检索算法、频率域的图像检索算法
一、引言
为了解决基于文本关键字的图像检索存在的问题,基于内容的图像检索方法成为图像检索的研究热点。基于内容的图像检索方法就是在将图像存入图像库的同时,自动提取反映该图像内容的特征向量,并存入与图像库相连的特征库。在进行图像检索时,对每一幅给定的查询图像自动提取该图像的特征向量,通过将该图像特征向量与特征库中的特征向量进行匹配,并根据匹配结果到图像库中搜索,就可提取出与所查询图像最相似的图像。
二、空间域图像检索算法
随着基于内容图像检索算法为人们所逐渐重视,空间(像素)域图像检索算法被广泛研究。所谓空间域图像检索是指直接在数字图像矩阵上提取图像特征,对图像进行相似性匹配,提取特征为颜色,形状和纹理信息。
2.1基于颜色的图像检索方法
颜色具有一定的稳定性,是图像最直观而明显的特征,因此成为检索中最常用的视觉特征。基于颜色的图像特征一般采用直方图来描述,其算法基本上都是以颜色直方图相交算法为基础而设计。用色彩特征进行图像检索可以追溯到Swain和Ballard提出的色彩直方图的方法。主要可以分为两类:全局色彩特征索引和局部色彩特征索引。
1、全局色彩特征索引
全局色彩特征索引方法目前采用最多的是色彩直方图的方法。Pass等人提出以图像的色彩聚合矢量CCV来作为图像的索引,它是图像直方图的一种演变。Stricker和Orengo提出了累计色彩直方图方法,并提出了色彩矩的方法,认为色彩信息集中在图像色彩的低阶矩中。他们对每种色彩分量的一阶、二阶和三阶矩进行统计。Rickman和Stonham提出了色彩元组直方图的方法,将一幅图像中的所有色彩用一些色彩元组来表示,这些色彩元组特征形成了一个特征编码簿,然后对一幅图像中特定位置的n个采样点所对应的色彩元组的特征值在特征编码簿中出现概率进行统计,就形成了一个色彩元组的直方图。
2、局部色彩特征索引
由于全局色彩特征索引捕获了整幅图像色彩分布的信息,丢失了许多局部的色彩空间信息。目前从划分局部区域的角度来说可分为:基于固定块的图像分割、基于手工的区域分割、采用交互的半自动的区域分割以及一些自动的色彩分割方法。局部区域中的色彩信息可以表示为平均色彩、主色彩、色彩直方图和二进制色彩集。
2.2基于形状的图像检索算法
基于形状特征的检索方法可分为基于轮廓和基于区域两大类。前者将图像进行分割并经过边缘提取后,得到目标图像的轮廓线,针对这种轮廓线进行的形状特征检索。后者直接针对图形寻找适当的矢量特征用于检索算法。但处理这种结构化检索更为复杂,需做更多的预处理。对于每一类方法,根据提取的形状特征来源于图像整体或者是部分区域,又可分为全局和结构两类。
1、基于轮廓的图像检索方法
基于轮廓的检索算法只利用了图像的边缘信息。根据图像轮廓的连续性将此类方法分为连续(全局)和离散(结构)两大类。连续性算法不会将图像分为子区域,描述图像形状的特征向量从整个边缘提取。相似性通常定义成在某个度量空间的两个特征向量的距离。离散性算法将形状边缘分为若干段,特征一般采用字符串或者图(树)的形势表示。对于这种算法的相似性度量一般采用字符串匹配或图匹配的方法。
2、基于区域的图像检索算法
在基于区域的检索算法中,所有在形状区域内部的像素点都被用来表示形状,基于区域的全局检索方法包括:利用矩特征来描述形状,比较常用的矩特征有Zernike矩和HU不变矩组。其他一些特征还包括形状矩阵,网格等;基于区域的结构局检索方法包括凸壳等。
2.3基于纹理的图像检索方法
Tamura概括了6个与人的视觉相关的纹理特征,分别为:粗糙度(Coarseness)、对比度(Contrast)、方向性(Directionality)、线相似性(Line likeness)、规则性(Regularity)和粗略度(Roughness)。但由于是对整幅图像进行处理,效果较差,改进方法是采用直方图。现在,绝大部分基于纹理的图像检索是在小波域下对图像进行检索。
三、频率域图像检索方法
在频率域图像检索技术中,DFT、KLT、DCT由于计算量太大,实际应用中很难达到用户要求,而小波以其良好的时频局部性及与人眼视觉特性相符的多分辨率分析能力,一经出现就被广泛用于图像压缩领域,从而促使小波变换在JPEG2000和MPEG中获得应用。目前小波域图像检索技术已得到多方面的研究。
3.1常用方法简介
第一类方法被统称为小波直方图法,是DWT域的典型算法之一,不但对纹理图像具有较好的检索效果,而且对于自然图像也很有效。其中Smith等人提出了基于小波系数的纹理识别算法。在该方法中,首先对图像进行三级小波分解,得到9个高频子带小波系数的幅度值。过上采样操作可将幅度系数值通恢复到与原图像相同的尺寸,其中位置相同的点组合起来,可组成一个9维矢量,对于M×N大小的图像,将得到M×N个9维矢量,从而构建一个512级统计直方图作为纹理特征来支持图像的检索。
第二类方法是子带能量法。这種方法的基本思路是通过对原始图像做小波分解,计算分解后每个子带的能量形成多的维特征矢量,将之用于检索。该类方法最早是由Chang等人提出的基于非规则树分解的纹理分析方法,在该方法中,用于纹理匹配的特征矢量通过计算子带系数的能量形成,纹理分类结果较好。Lee等在文献中为了在降低计算复杂度的同时取得很好的分类结果,仅仅选择包分解子带中能量较大的7个子带形成特征矢量,降低了小波包分解时能量特征矢量的维数。近年来,很多研究者通过选取不同的小波基(正交基、双正交基)、不同的小波分解方法(塔式小波分解、小波包分解等) 以及不同的子带能量计算法等对这种方法进行了深入研究。
3.2频率域图像检索方法优缺点
当观察图像时,通常看到的是相连接的纹理与灰度级相似的区域,如果物体的尺寸很小或对比度不高,通常采用叫高分辨率观察;如果物体的尺寸很大或对比度很强,只需要较低的分辨率。如果一幅图像中物体尺寸有大有小或对比有强有弱的时候,以若干分辨率对他们进行研究将具有优势。但是具有如下缺点:
很多研究者采用小波变换进行图像检索研究,但他们采用的大多是一般的经典单小波方法,已有的优化方法的运算也还是依赖于傅立叶变换,计算复杂度高,资源消耗大,对于即时在线的查找有很大不利。如何优化经典小波变换运算,减少计算量是我们要研究的第一个问题。
在图像采集过程中,将不可避免的受到噪声干扰,采用传统小波变换,由于消失矩固定,导致这些噪声在图像中产生的很多细微突变,可能会被误认为是图像本身细节,分解后的子带图像不能很好的表征原图像特性。
图像检索技术虽然已经历经较长时间的研究,综合国内外研究成果,还没找到一个统一公认的能够作为图像唯一标志的特征,当然这也与图像相似性的复杂性有关。图像的相似性不仅指几何变换的不变性,还包括视觉变换的不变性,如何找到一个特征能较好描述图像,使检索结果具有上述两种不变性。
参考文献:
[1]李向阳,庄越挺,潘云鹤。《基于内容的图像检索技术综述》计算机研究与发展 2001,3
[2]田玉敏,林高全。《基于颜色特征的彩色图像检索方法》西安电子科技大学学报2000,9