论文部分内容阅读
[摘 要]提出基于内容的图像检索,即CBIR(Content-based image retrieval),是计算机视觉领域中关注大规模数字图像内容检索的研究分支。典型的CBIR系统,允许用户输入一张图片,以查找具有相同或相似内容的其他图片。
[关键词]CBIR技术 特征提取 颜色特征 纹理特征 形状特征 特征匹配Sobel算子 小波变换
中图分类号:D296.1 文献标识码:A 文章编号:1009-914X(2014)28-0306-01
0、引言
基于CBIR 技术的图像检索系统,在建立图像数据库时, 系统对输入的图像进行分析并分类统一建模, 根据各种图像模型提取图像特征存入特征库, 同时对特征库建立索引以提高查找效率。CBIR的核心是使用图像的可视特征对图像进行检索。本篇主要介绍图像的特征提取。
1、颜色特征提取
颜色特征的四种描述方法:颜色直方图、颜色相关图、颜色矩、颜色一致性矢量。
1.1 颜色直方图
直方图与图像是一对多的关系。一般情况下,由于图像上的背景和前景物体颜色分布明显不同,从而在直方图上会出现双峰特性,但背景和前景颜色较为接近的图像不具有这个特性。
1.2 颜色相关图
传统的颜色直方图只考虑了颜色信息。(MODELING)假设图像的记号为I(x,y),x、y为空间坐标;包含的颜色有C1,C2,C3...Cn.设置两种颜色之间的距离为d.那我们将生成这样的一个直方图:它的bin的个数为n的平方(颜色的组合数目),对于其中的每个Bin,Bin的大小为Bin(Ci,Cj) = Σx,y{||I(x,y,Ci)-I(x,y,Cj)|| = d}。其中,||*||表示像素值为Ci,Cj的两个像素的空间距离,然后统计这样的像素个数。所以,要是设置不同的距离d1,d2,d3...dm(共D个).那个Bin的维数(n*n*D)。
1.3 颜色矩
颜色矩是一种简单有效的颜色特征表示方法,有一阶矩(均值,mean)、二阶矩(方差,viarance)和三阶矩(斜度,skewness)等,由于颜色信息主要分布于低阶矩中,所以用一阶矩,二阶矩和三阶矩足以表达图像的颜色分布,颜色矩已证明可有效地表示图像中的颜色分布,该方法的优点在于:不需要颜色空间量化,特征向量维数低;但实验发现该方法的检索效率比较低,因而在实际应用中往往用来过滤图像以缩小检索范围。
2、形状特征提取
形状特征提取分为边缘检测特征和区域特征。边缘特征的经典算法有Sobel边缘检测算法和Roberts边缘检测算法等。区域特征分为阈值法、区域生长和分裂合并。形状特征提取本篇以边缘检测为论述点,重点介绍Soble算子。
边缘是指图像中亮度突然变化的区域,主要包括对象与对象的界线和对象与背景的界线。边缘检测的原理就是检测图像中亮度变化明显的点。边缘处亮度变化很大,所以导数值很大。边缘检测的实质就是计算亮度变化的导数。若导数很大超过一定的阈值则可以判定该点为边缘。
一般的图像都是二维离散函数,不易理解。为了简化该模型,我们首先在一维空间对边缘检测进行分析。分析该一维数据,画出相应的函数图像我们可以直观地说在第4与第5个点之间有一个边缘。
设n代表是第几个像素,f代表该像素的亮度。导数值分析也是在第4和5个之间有边缘。
由一维空间延伸到二维空间。在二维空间中边缘是由亮度的不连续性所反映的,有方向和幅度两个特性。一般认为沿边缘走向的亮度变化较为平缓,而垂直边缘走向的亮度变化剧烈。这种变化可能呈阶跃形,也可能呈屋顶形或斜坡形。因此边缘可以分为阶跃性边缘、屋脊状边缘和斜坡形边缘。在二维图像中二维离散函数的一阶导数即为图像梯度。二维空间中由于导数往往不能直接得到,一个常用的办法是用核算子来估计导数,计算图像梯度的近似值。其中最著名的算法是Sobel边缘检测算法。Sobel算子是基于一阶微分的边缘检测方法,首先进行邻域平均或加权平均,然后进行一阶微分处理,检测出边缘点。在图像的任何一点使用此算子,将会产生对应的梯度矢量。
soel算子包含两组3x3的矩阵,dx为水平梯度方向,检测垂直边缘;dy为垂直梯度方向,检测水平边缘。将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分。这里用亮度差分近似替代一阶偏导。然后选取合适的阈值来提取边缘。如果以A代表原始图像,Gx及Gy分别代表经横向及纵向边缘检测的图像亮度值。实质就是用一个3×3的窗口来对图像进行近似求导。拿对X方向求导为例,某一点的导数为第三列的元素之和减去第一列元素之和,这样就求得了某一点的近似导数。而由于求的是3×3中心点的导数,所以给第二列加了一个权重,它的权重为2,第一列和第三列的权重为1,这也就是所谓的邻域加权。
3、纹理特征提取
纹理特征代表了物体的视觉模式,它包含了物体表面的组织结构以及与周围环境之间的关系。常用的方法有相关矩阵法,粗糙度、对比度等纹理表示方法,以及小波变换等。图像的基本纹理特征主要方面:粗糙度、对比度、方向度 、线像度 、规整度和粗略度.
纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。 但由于纹理只是一种物体表面的特性,并不能完全反映出物 体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统 计计算。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪 声有较强的抵抗能力。 但是,纹理特征也有其缺点,尤其当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到 光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。
纹理分析的方法主要有:1)统计法。统计法分析纹理的主要思想是通过图像中灰度级分布的随机属性来描述纹理特征。最简单的统计法是借助于灰度直方图的矩来描述纹理,但这种方法没有利用像素相对位置的空间信息。2)频谱法。频谱法借助于频率特性来描述纹理特征,包括傅里叶功率谱法、Gabor变换、塔式小波变换( PWT)、树式小波变换( TWT)等方法。3)模型法。模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法 4)信号处理法。纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。
参考文献
[1] MarkS.Nixon,《特征提取与图像处理》 电子工业出版社.
[2] Yong Zeng,ShuSen Sun,AiJun Xia,基于图像归一化和DCT的感知图像哈希算法.浙江理工大学报673-3851(2012)01-0084-05.
[关键词]CBIR技术 特征提取 颜色特征 纹理特征 形状特征 特征匹配Sobel算子 小波变换
中图分类号:D296.1 文献标识码:A 文章编号:1009-914X(2014)28-0306-01
0、引言
基于CBIR 技术的图像检索系统,在建立图像数据库时, 系统对输入的图像进行分析并分类统一建模, 根据各种图像模型提取图像特征存入特征库, 同时对特征库建立索引以提高查找效率。CBIR的核心是使用图像的可视特征对图像进行检索。本篇主要介绍图像的特征提取。
1、颜色特征提取
颜色特征的四种描述方法:颜色直方图、颜色相关图、颜色矩、颜色一致性矢量。
1.1 颜色直方图
直方图与图像是一对多的关系。一般情况下,由于图像上的背景和前景物体颜色分布明显不同,从而在直方图上会出现双峰特性,但背景和前景颜色较为接近的图像不具有这个特性。
1.2 颜色相关图
传统的颜色直方图只考虑了颜色信息。(MODELING)假设图像的记号为I(x,y),x、y为空间坐标;包含的颜色有C1,C2,C3...Cn.设置两种颜色之间的距离为d.那我们将生成这样的一个直方图:它的bin的个数为n的平方(颜色的组合数目),对于其中的每个Bin,Bin的大小为Bin(Ci,Cj) = Σx,y{||I(x,y,Ci)-I(x,y,Cj)|| = d}。其中,||*||表示像素值为Ci,Cj的两个像素的空间距离,然后统计这样的像素个数。所以,要是设置不同的距离d1,d2,d3...dm(共D个).那个Bin的维数(n*n*D)。
1.3 颜色矩
颜色矩是一种简单有效的颜色特征表示方法,有一阶矩(均值,mean)、二阶矩(方差,viarance)和三阶矩(斜度,skewness)等,由于颜色信息主要分布于低阶矩中,所以用一阶矩,二阶矩和三阶矩足以表达图像的颜色分布,颜色矩已证明可有效地表示图像中的颜色分布,该方法的优点在于:不需要颜色空间量化,特征向量维数低;但实验发现该方法的检索效率比较低,因而在实际应用中往往用来过滤图像以缩小检索范围。
2、形状特征提取
形状特征提取分为边缘检测特征和区域特征。边缘特征的经典算法有Sobel边缘检测算法和Roberts边缘检测算法等。区域特征分为阈值法、区域生长和分裂合并。形状特征提取本篇以边缘检测为论述点,重点介绍Soble算子。
边缘是指图像中亮度突然变化的区域,主要包括对象与对象的界线和对象与背景的界线。边缘检测的原理就是检测图像中亮度变化明显的点。边缘处亮度变化很大,所以导数值很大。边缘检测的实质就是计算亮度变化的导数。若导数很大超过一定的阈值则可以判定该点为边缘。
一般的图像都是二维离散函数,不易理解。为了简化该模型,我们首先在一维空间对边缘检测进行分析。分析该一维数据,画出相应的函数图像我们可以直观地说在第4与第5个点之间有一个边缘。
设n代表是第几个像素,f代表该像素的亮度。导数值分析也是在第4和5个之间有边缘。
由一维空间延伸到二维空间。在二维空间中边缘是由亮度的不连续性所反映的,有方向和幅度两个特性。一般认为沿边缘走向的亮度变化较为平缓,而垂直边缘走向的亮度变化剧烈。这种变化可能呈阶跃形,也可能呈屋顶形或斜坡形。因此边缘可以分为阶跃性边缘、屋脊状边缘和斜坡形边缘。在二维图像中二维离散函数的一阶导数即为图像梯度。二维空间中由于导数往往不能直接得到,一个常用的办法是用核算子来估计导数,计算图像梯度的近似值。其中最著名的算法是Sobel边缘检测算法。Sobel算子是基于一阶微分的边缘检测方法,首先进行邻域平均或加权平均,然后进行一阶微分处理,检测出边缘点。在图像的任何一点使用此算子,将会产生对应的梯度矢量。
soel算子包含两组3x3的矩阵,dx为水平梯度方向,检测垂直边缘;dy为垂直梯度方向,检测水平边缘。将之与图像作平面卷积,即可分别得出横向及纵向的亮度差分。这里用亮度差分近似替代一阶偏导。然后选取合适的阈值来提取边缘。如果以A代表原始图像,Gx及Gy分别代表经横向及纵向边缘检测的图像亮度值。实质就是用一个3×3的窗口来对图像进行近似求导。拿对X方向求导为例,某一点的导数为第三列的元素之和减去第一列元素之和,这样就求得了某一点的近似导数。而由于求的是3×3中心点的导数,所以给第二列加了一个权重,它的权重为2,第一列和第三列的权重为1,这也就是所谓的邻域加权。
3、纹理特征提取
纹理特征代表了物体的视觉模式,它包含了物体表面的组织结构以及与周围环境之间的关系。常用的方法有相关矩阵法,粗糙度、对比度等纹理表示方法,以及小波变换等。图像的基本纹理特征主要方面:粗糙度、对比度、方向度 、线像度 、规整度和粗略度.
纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。 但由于纹理只是一种物体表面的特性,并不能完全反映出物 体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统 计计算。作为一种统计特征,纹理特征常具有旋转不变性,并且对于噪 声有较强的抵抗能力。 但是,纹理特征也有其缺点,尤其当图像的分辨率变化的时候,所计算出来的纹理可能会有较大偏差。另外,由于有可能受到 光照、反射情况的影响,从2-D图像中反映出来的纹理不一定是3-D物体表面真实的纹理。
纹理分析的方法主要有:1)统计法。统计法分析纹理的主要思想是通过图像中灰度级分布的随机属性来描述纹理特征。最简单的统计法是借助于灰度直方图的矩来描述纹理,但这种方法没有利用像素相对位置的空间信息。2)频谱法。频谱法借助于频率特性来描述纹理特征,包括傅里叶功率谱法、Gabor变换、塔式小波变换( PWT)、树式小波变换( TWT)等方法。3)模型法。模型法以图像的构造模型为基础,采用模型的参数作为纹理特征。典型的方法是随机场模型法,如马尔可夫(Markov)随机场(MRF)模型法和 Gibbs 随机场模型法 4)信号处理法。纹理特征的提取与匹配主要有:灰度共生矩阵、Tamura 纹理特征、自回归纹理模型、小波变换等。
参考文献
[1] MarkS.Nixon,《特征提取与图像处理》 电子工业出版社.
[2] Yong Zeng,ShuSen Sun,AiJun Xia,基于图像归一化和DCT的感知图像哈希算法.浙江理工大学报673-3851(2012)01-0084-05.