论文部分内容阅读
摘要针对基于边缘检测的图像检索中边缘点容易受到噪声干扰的问题,提出一种基于LoG边缘算子的棉花图像检索算法。首先在求取边缘检测前进行滤除噪声处理,然后根据欧式距离衡量图像间的相似性。棉花图像数据集的试验结果表明,算法能够有效去除边缘噪声,提高了图像检索的查全率和查准率,尤其适用于高噪声环境下的棉花图像检索。
关键词图像检索;LoG算子;边缘检测;欧氏距离
中图分类号S126;TP391文献标识码
A文章编号0517-6611(2014)28-10007-02
Research of Cotton Image Retrieval Algorithm Based on LoG Operator
RUAN Xuliang, XIA Bin, SANG Xiaotian et al(Zhengzhou Cotton & Jute Engineering Technology and Design Research Institute, China COOP, Zhengzhou, Henan 450004)
Abstract For the problem of image edge noise in the cotton image retrieval based on edge detection, a new algorithm using LoG edge operator was proposed. Firstly, the LoG operator was used to filter out noise before edge detection, then the similarity among images were measured according to Euclidean distance. Under the cotton image data sets, experimental results showed that the algorithm can remove edge noise and improve the image retrieval recall and precision effectively, especially for image retrieval of high noise environments.
Key words Image retrieval; LoG operator; Edge detection; Euclidean distance
随着计算机视觉的飞速发展,以及数字图像的大量应用,人们迫切需要一种方法检索近似图像,因此,图像检索技术应运而生。图像检索是一个与计算机视觉、图像处理、数据库等学科紧密联系的综合性研究领域,它是以图像本身的物理属性或者描述关键词在图像数据库中尋找与示例图像相关或者相似的图像[1]。在图像检索领域中,基于内容的图像检索 (Content-Based Image Retrieval,CBIR)[2]是根据图像的色彩(Color)、形状(Shape)、纹理(Texture)等物理属性检索相似图像,现已成为图像检索的有效方法。
在众多图像特征中,形状是较为显著的特征之一,而形状的提取是以边缘检测[3]为前提,因此,边缘检测的结果直接影响到检索的效果[4-6]。为了提高基于边缘检测的图像检索系统性能,国内外研究人员针对边缘检测和图像相似度衡量进行了大量研究。王植等提出使用对灰度梯度的幅值和方向进行非极大值抑制,然后采用双阈值方法从候选边缘点中检测和连接边缘[7];李牧等提出采用类内方差最小化和梯度幅度直方图动态地确定上下阈值的方法,来提高Canny 算子的动态适应性[8];Sarangi等提出采用模糊推理改进对图像边缘的检测,并且结合Canny 算子检测边缘[9];赵宏中等提出使用Manhanttan距离衡量图像间的相似性[10]。
在上述研究的基础上,笔者提出一种基于LoG算子的棉花图像检索算法,在降噪处理的基础上获取图像边缘,根据欧氏距离衡量图像间的相似性,并在棉花数据集上进行了试验验证。
1LoG算子
LoG算子(Laplacian of Gaussian,LoG),也称作拉普拉斯高斯算法[11-12],它是将拉普拉斯边缘检测结合高斯滤波形成的[13-16]。算法的特点是图像先与高斯滤波器g(x,y)进行卷积,用于平滑图像、降低噪声,同时滤除孤立的噪声点和较小的疵点,然后采用无方向性的拉普拉斯算子D2进行边缘检测[17-19]。假设原图像为f(x,y),通过卷积和拉普拉斯算子处理,得到输出图像h(x,y):
称为高斯拉普拉斯算子,对于离散数字图像,高斯拉普拉斯算子通常可以用一个离散的模板近似。通常的高斯拉普拉斯算子是一个5×5的模板,如图1所示。
01/801/801/81/211/21/801-7101/81/211/21/801/801/80
图1高斯拉普拉斯模板
此模板水平和垂直的4个方向上都设置为1,对角的4个方向上都设置为1/2,其他8个方向上都设置为1/8,这样就会造成水平和垂直的4个方向边缘检测精度高,而其他12个方向的边缘检测精度低。
2图像间相似性度量
图像间的相似性度量[20]是基于内容的图像检索中的关键环节,它是在图像内容的基础上,由其内容的相似度而得到图像相似性的一种度量方法。其中,图像低层次上的特征主要包括图像本身的颜色特征、纹理特征、形状特征以及空间关系特征,具有相对直观的特点,而语义信息是图像深层次上的特征,具有相对抽象的特点。
目前对于图像间相似性度量的研究主要集中在图像的颜色特征、纹理特征、形状特征以及空间关系特征,图像的特征通过向量的形式表示。在此基础上,通常采用向量空间模型来衡量图像间相似度,根据计算向量间两点之间的远近程度来衡量图像间的相似程度。
在模式识别领域中,特征的相似度量多采用距离方法,也即是特征之间的相似程度用向量的空间距离表示,距离越大,图像间的差别就越大,反之,就越相似。
3基于LoG算子的棉花图像检索算法
3.1图像特征的表达
由于傅里叶描述子具有旋转不变性、转置不变性、与起始点无关的特点,因此,采用傅里叶描述子来描述边缘向量,并以此作为图像的形状特征。
3.2相似图像判定
图像的相似性可以使用满足测度空间条件的空间距离来衡量,距离函数需要满足测度空间的3个测度公理。
关键词图像检索;LoG算子;边缘检测;欧氏距离
中图分类号S126;TP391文献标识码
A文章编号0517-6611(2014)28-10007-02
Research of Cotton Image Retrieval Algorithm Based on LoG Operator
RUAN Xuliang, XIA Bin, SANG Xiaotian et al(Zhengzhou Cotton & Jute Engineering Technology and Design Research Institute, China COOP, Zhengzhou, Henan 450004)
Abstract For the problem of image edge noise in the cotton image retrieval based on edge detection, a new algorithm using LoG edge operator was proposed. Firstly, the LoG operator was used to filter out noise before edge detection, then the similarity among images were measured according to Euclidean distance. Under the cotton image data sets, experimental results showed that the algorithm can remove edge noise and improve the image retrieval recall and precision effectively, especially for image retrieval of high noise environments.
Key words Image retrieval; LoG operator; Edge detection; Euclidean distance
随着计算机视觉的飞速发展,以及数字图像的大量应用,人们迫切需要一种方法检索近似图像,因此,图像检索技术应运而生。图像检索是一个与计算机视觉、图像处理、数据库等学科紧密联系的综合性研究领域,它是以图像本身的物理属性或者描述关键词在图像数据库中尋找与示例图像相关或者相似的图像[1]。在图像检索领域中,基于内容的图像检索 (Content-Based Image Retrieval,CBIR)[2]是根据图像的色彩(Color)、形状(Shape)、纹理(Texture)等物理属性检索相似图像,现已成为图像检索的有效方法。
在众多图像特征中,形状是较为显著的特征之一,而形状的提取是以边缘检测[3]为前提,因此,边缘检测的结果直接影响到检索的效果[4-6]。为了提高基于边缘检测的图像检索系统性能,国内外研究人员针对边缘检测和图像相似度衡量进行了大量研究。王植等提出使用对灰度梯度的幅值和方向进行非极大值抑制,然后采用双阈值方法从候选边缘点中检测和连接边缘[7];李牧等提出采用类内方差最小化和梯度幅度直方图动态地确定上下阈值的方法,来提高Canny 算子的动态适应性[8];Sarangi等提出采用模糊推理改进对图像边缘的检测,并且结合Canny 算子检测边缘[9];赵宏中等提出使用Manhanttan距离衡量图像间的相似性[10]。
在上述研究的基础上,笔者提出一种基于LoG算子的棉花图像检索算法,在降噪处理的基础上获取图像边缘,根据欧氏距离衡量图像间的相似性,并在棉花数据集上进行了试验验证。
1LoG算子
LoG算子(Laplacian of Gaussian,LoG),也称作拉普拉斯高斯算法[11-12],它是将拉普拉斯边缘检测结合高斯滤波形成的[13-16]。算法的特点是图像先与高斯滤波器g(x,y)进行卷积,用于平滑图像、降低噪声,同时滤除孤立的噪声点和较小的疵点,然后采用无方向性的拉普拉斯算子D2进行边缘检测[17-19]。假设原图像为f(x,y),通过卷积和拉普拉斯算子处理,得到输出图像h(x,y):
称为高斯拉普拉斯算子,对于离散数字图像,高斯拉普拉斯算子通常可以用一个离散的模板近似。通常的高斯拉普拉斯算子是一个5×5的模板,如图1所示。
01/801/801/81/211/21/801-7101/81/211/21/801/801/80
图1高斯拉普拉斯模板
此模板水平和垂直的4个方向上都设置为1,对角的4个方向上都设置为1/2,其他8个方向上都设置为1/8,这样就会造成水平和垂直的4个方向边缘检测精度高,而其他12个方向的边缘检测精度低。
2图像间相似性度量
图像间的相似性度量[20]是基于内容的图像检索中的关键环节,它是在图像内容的基础上,由其内容的相似度而得到图像相似性的一种度量方法。其中,图像低层次上的特征主要包括图像本身的颜色特征、纹理特征、形状特征以及空间关系特征,具有相对直观的特点,而语义信息是图像深层次上的特征,具有相对抽象的特点。
目前对于图像间相似性度量的研究主要集中在图像的颜色特征、纹理特征、形状特征以及空间关系特征,图像的特征通过向量的形式表示。在此基础上,通常采用向量空间模型来衡量图像间相似度,根据计算向量间两点之间的远近程度来衡量图像间的相似程度。
在模式识别领域中,特征的相似度量多采用距离方法,也即是特征之间的相似程度用向量的空间距离表示,距离越大,图像间的差别就越大,反之,就越相似。
3基于LoG算子的棉花图像检索算法
3.1图像特征的表达
由于傅里叶描述子具有旋转不变性、转置不变性、与起始点无关的特点,因此,采用傅里叶描述子来描述边缘向量,并以此作为图像的形状特征。
3.2相似图像判定
图像的相似性可以使用满足测度空间条件的空间距离来衡量,距离函数需要满足测度空间的3个测度公理。