论文部分内容阅读
[摘 要]基于内容的图像检索技术是一项综合集成技术,本文提出了基于内容的图像检索系统设计思路,并对其中应用到的图像的颜色特征、纹理特征、轮廓特征、形状特征以及语义特征等进行了详细的分析,最后探讨了图像检索的相关反馈技术,希望能够为相关的理论和实践提供一定的参考意义。
[关键词]内容;图像;检索技术;颜色;纹理;语义;轮廓;特征
中图分类号:TP391.3 文献标识码:A 文章编号:1009-914X(2016)06-0373-01
1、引言
随着信息技术的飞速发展,人们更加频繁地接触到图像和视频信息,而且这些信息每天都在呈现爆炸式的增长,从而使得相关的管理和检索成为了必要。而在传统的检索方式中,主要采用的是基于关键词的检索方式。而图像信息内容有着更加丰富的内涵,在很多情况下,若干个关键词是难以充分描述的,在该种背景下,基于内容的图像检索技术便应运而生了,其能够有效弥补传统检索手段的不足。
2、图像检索的主要分类
当前根据检索系统提供给用户的查询方式可以将图像检索分为相关查询、目标查询以及范畴查询等三种方式。在相关查询方式下,用户并没有特定的查询目标,而是通过对非限定图像源来查找感兴趣的东西,也即查找类似的图像,在该种查询方式下通常应用相关反馈方法来对图像查询结果进行优化,具有较高的交互性。目标查询的目标性比较明确,即是对用户印象中的某一个图像或者具有相同目标物的其他图像进行查找,而且还可以根据用户迭代制定的一组图例来查找出最为相似的图像。范畴查询查询指定类型的任意代表图像,在该种方式下,用户可能已经拥有一副图像或者一组图像,而通过范畴查询的主要目的便是得到同类的图像,图像类别可根据图像标记得到也可直接来自于数据库,该类查询通常是根据相关领域指定的相似性来定义迭代优化检索结果。
3、基于内容的图像检索系统设计
基于内容的图像手段和传统的检索手段不同,其主要是将图像的颜色特征、纹理特征、轮廓特征、形状特征以及语义特征等进行充分利用和检索,然后将这些特征进行量化之后和图像存储在一起。其使用的主要是基于相似度量的示例查询方法。而本文所描述的基于内容的图像检索系统可以看成是基于数据库与信息用户之间的一种信息服务。下图展示了其基本的框架结构:
可见,在该系统中,首先用户向系统发出查询的要求,系统将用戶的查询要求转化为计算机内部的描述,并借助于这些信息开始于数据库中存储的图像特征信息进行匹配,以提取出用户所需要的信息数据,而用户还可以通过人机交互界面利用相关的反馈技术对查询条件进行改进并进行新一轮的检索。
4、图像的内容描述
4.1图像数据内容
所谓图像数据内容,是指使用整数值表示的数字图像各像素的灰度值的集合,像素是图像数据信息的基本组成单位。虽然每一个像素都有着确切的值,但是对于其所表示的对象来说并没有明确的意义,远远低于图像所表达的语义意义。因此,如何才能寻找到由原始像素值转换成合适的图像内容就显得非常重要。而目前图像的数据内容主要由颜色特征、纹理特征、轮廓特征、形状特征以及语义特征等几方面来表示。
4.2颜色特征
在图像内容中,颜色是最为基本的要素,人们通过对颜色进行感知来达到识别图像的目的。主颜色、总体颜色以及颜色分布是颜色最为重要的三个特征。主颜色可以称之为图像的主色调,是构成图像的主要颜色,其可以包括多种颜色。图像中各种颜色出现的频度能够称为总体颜色,正是由于其具有适合人眼感知的特征,因此可以基于Munsell三维颜色空间HIS(色度、亮度以及饱和度)。和图像的其他特征相比,颜色特征的稳定性更加明显,即使进行平移、尺度以及旋转变化,甚至对于其余形变也不敏感,有着很强的鲁莽性。更重要的是,颜色特征计算比较简便,很适合在图像内容检索中应用。
4.3纹理特征
图像的纹理特征主要是对图像的像素灰度级空间分布的属性进行反映,该种特征相关的技术在遥感、计算机视觉中有着很好的应用前景。我们可以将纹理定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量。纹理元是其最为基本的单元。通过图像的纹理特征可以对图像的空间信息在一定程度上进行相关的定量描述。如果物体内部的灰度级变化明显又不是简单的色调变化,那么该物体就有纹理。它适合用来描述、区分诸如山脉、草木、砖瓦、布匹等图像。
4.4轮廓、形状特征
图像的轮廓和形状特征主要是指整个图像或图像中子对象的边缘特征。轮廓(Sketch)的特征量能够较好地区别不同内容的图像。在对轮廓特征进行提取时,首先需要使用Sohel算子对图像像素的亮度值进行计算,以获得轮廓图像,然后将图像平均分成若干块,对每个分割块区域中的轮廓点数量进行统计,建立轮廓点的三维投影直方图。在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述 。
4.5 语义特征
图像的语义特征是对图像的文本描述,可以理解为对图像的高度概况。所谓图像的语义特征主要是对图像的某一特征在特定领域之内的语义信息进行描述。在特征视图层,主要是分析图像的内容,如图像的空间关系、形状、色彩等,这一层用户主要关心图像所包含的视觉内容。通常情况下,可以将语义特征与颜色特征、纹理特征等图像的其他特征合并使用,能够有效提升图像基于内容的检索能力。
5、基于内容的图像检索系统相关反馈技术
在本文中提出的基于内容的图像检索系统相关反馈技术中,其主要的工作原理为,在检索过程中,允许用户对检索结果进行标记和评价,指出查询结果中哪些信息与查询图像是相关的,而哪些又是无关的,之后将标记的相关样本作为训练样本反馈给系统进行学习,并指导下一轮的检索,从而最终达到使得检索结果更加符合用户需要的目的。
目前应用较多的相关反馈方法有基于支持向量机(SVM)的相关反馈方法以及基于 Bayes准则 的相关反馈方法。其中基于支持向量机(SVM)的相关反馈方法主要是对每次反馈过程中用户标记的正、反例样本进行学习,建立 SV M 分类器作为模型,并根据该模型进行检索 。在每次反馈过程中,如果用户标记的样本是在特征空间中属性相近的图像,即作为支撑向量的样本,则因为距离较远的样本对SVM分类器没有影响,所以虽然用户标记 的反馈图像有限,但是对于建立SVM分类器已经足够,可以有效地控制机器学习的推广能力。不过该种方法在核函数的选取方面还是存在着一定的难度,其直接关系到分类器的泛化能力。而且用于反馈的图像必须在标记边界和最优的图像之中做出折中的选择,这也是其一个不足之处。
6、结束语
总之,基于内容的图像检索是一项综合集成的技术,尽管目前该项技术仍然还需要进行完善,但是笔者相信,随着未来研究的进一步深入和发展,其相应的功能也必将会越来越强大,从而为我国科技进步和社会发展贡献出新的力量。
参考文献
[1]张璟,杨红岗,陈皇丹. 基于内容的图像检索技术在网络购物中的应用与发展研究[J]. 农业图书情报学刊,2015,10:37-39.
[2]陈瑞文. 基于内容的图像检索-感兴趣区域的提取[J]. 通化师范学院学报,2014,10:53-55.
[3]顾昕,张兴亮,王超,陈思媛,方正. 基于文本和内容的图像检索算法[J]. 计算机应用,2014,S2:280-282+313.
[关键词]内容;图像;检索技术;颜色;纹理;语义;轮廓;特征
中图分类号:TP391.3 文献标识码:A 文章编号:1009-914X(2016)06-0373-01
1、引言
随着信息技术的飞速发展,人们更加频繁地接触到图像和视频信息,而且这些信息每天都在呈现爆炸式的增长,从而使得相关的管理和检索成为了必要。而在传统的检索方式中,主要采用的是基于关键词的检索方式。而图像信息内容有着更加丰富的内涵,在很多情况下,若干个关键词是难以充分描述的,在该种背景下,基于内容的图像检索技术便应运而生了,其能够有效弥补传统检索手段的不足。
2、图像检索的主要分类
当前根据检索系统提供给用户的查询方式可以将图像检索分为相关查询、目标查询以及范畴查询等三种方式。在相关查询方式下,用户并没有特定的查询目标,而是通过对非限定图像源来查找感兴趣的东西,也即查找类似的图像,在该种查询方式下通常应用相关反馈方法来对图像查询结果进行优化,具有较高的交互性。目标查询的目标性比较明确,即是对用户印象中的某一个图像或者具有相同目标物的其他图像进行查找,而且还可以根据用户迭代制定的一组图例来查找出最为相似的图像。范畴查询查询指定类型的任意代表图像,在该种方式下,用户可能已经拥有一副图像或者一组图像,而通过范畴查询的主要目的便是得到同类的图像,图像类别可根据图像标记得到也可直接来自于数据库,该类查询通常是根据相关领域指定的相似性来定义迭代优化检索结果。
3、基于内容的图像检索系统设计
基于内容的图像手段和传统的检索手段不同,其主要是将图像的颜色特征、纹理特征、轮廓特征、形状特征以及语义特征等进行充分利用和检索,然后将这些特征进行量化之后和图像存储在一起。其使用的主要是基于相似度量的示例查询方法。而本文所描述的基于内容的图像检索系统可以看成是基于数据库与信息用户之间的一种信息服务。下图展示了其基本的框架结构:
可见,在该系统中,首先用户向系统发出查询的要求,系统将用戶的查询要求转化为计算机内部的描述,并借助于这些信息开始于数据库中存储的图像特征信息进行匹配,以提取出用户所需要的信息数据,而用户还可以通过人机交互界面利用相关的反馈技术对查询条件进行改进并进行新一轮的检索。
4、图像的内容描述
4.1图像数据内容
所谓图像数据内容,是指使用整数值表示的数字图像各像素的灰度值的集合,像素是图像数据信息的基本组成单位。虽然每一个像素都有着确切的值,但是对于其所表示的对象来说并没有明确的意义,远远低于图像所表达的语义意义。因此,如何才能寻找到由原始像素值转换成合适的图像内容就显得非常重要。而目前图像的数据内容主要由颜色特征、纹理特征、轮廓特征、形状特征以及语义特征等几方面来表示。
4.2颜色特征
在图像内容中,颜色是最为基本的要素,人们通过对颜色进行感知来达到识别图像的目的。主颜色、总体颜色以及颜色分布是颜色最为重要的三个特征。主颜色可以称之为图像的主色调,是构成图像的主要颜色,其可以包括多种颜色。图像中各种颜色出现的频度能够称为总体颜色,正是由于其具有适合人眼感知的特征,因此可以基于Munsell三维颜色空间HIS(色度、亮度以及饱和度)。和图像的其他特征相比,颜色特征的稳定性更加明显,即使进行平移、尺度以及旋转变化,甚至对于其余形变也不敏感,有着很强的鲁莽性。更重要的是,颜色特征计算比较简便,很适合在图像内容检索中应用。
4.3纹理特征
图像的纹理特征主要是对图像的像素灰度级空间分布的属性进行反映,该种特征相关的技术在遥感、计算机视觉中有着很好的应用前景。我们可以将纹理定义为图像的某种局部性质,或是对局部区域中像素之间关系的一种度量。纹理元是其最为基本的单元。通过图像的纹理特征可以对图像的空间信息在一定程度上进行相关的定量描述。如果物体内部的灰度级变化明显又不是简单的色调变化,那么该物体就有纹理。它适合用来描述、区分诸如山脉、草木、砖瓦、布匹等图像。
4.4轮廓、形状特征
图像的轮廓和形状特征主要是指整个图像或图像中子对象的边缘特征。轮廓(Sketch)的特征量能够较好地区别不同内容的图像。在对轮廓特征进行提取时,首先需要使用Sohel算子对图像像素的亮度值进行计算,以获得轮廓图像,然后将图像平均分成若干块,对每个分割块区域中的轮廓点数量进行统计,建立轮廓点的三维投影直方图。在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述 。
4.5 语义特征
图像的语义特征是对图像的文本描述,可以理解为对图像的高度概况。所谓图像的语义特征主要是对图像的某一特征在特定领域之内的语义信息进行描述。在特征视图层,主要是分析图像的内容,如图像的空间关系、形状、色彩等,这一层用户主要关心图像所包含的视觉内容。通常情况下,可以将语义特征与颜色特征、纹理特征等图像的其他特征合并使用,能够有效提升图像基于内容的检索能力。
5、基于内容的图像检索系统相关反馈技术
在本文中提出的基于内容的图像检索系统相关反馈技术中,其主要的工作原理为,在检索过程中,允许用户对检索结果进行标记和评价,指出查询结果中哪些信息与查询图像是相关的,而哪些又是无关的,之后将标记的相关样本作为训练样本反馈给系统进行学习,并指导下一轮的检索,从而最终达到使得检索结果更加符合用户需要的目的。
目前应用较多的相关反馈方法有基于支持向量机(SVM)的相关反馈方法以及基于 Bayes准则 的相关反馈方法。其中基于支持向量机(SVM)的相关反馈方法主要是对每次反馈过程中用户标记的正、反例样本进行学习,建立 SV M 分类器作为模型,并根据该模型进行检索 。在每次反馈过程中,如果用户标记的样本是在特征空间中属性相近的图像,即作为支撑向量的样本,则因为距离较远的样本对SVM分类器没有影响,所以虽然用户标记 的反馈图像有限,但是对于建立SVM分类器已经足够,可以有效地控制机器学习的推广能力。不过该种方法在核函数的选取方面还是存在着一定的难度,其直接关系到分类器的泛化能力。而且用于反馈的图像必须在标记边界和最优的图像之中做出折中的选择,这也是其一个不足之处。
6、结束语
总之,基于内容的图像检索是一项综合集成的技术,尽管目前该项技术仍然还需要进行完善,但是笔者相信,随着未来研究的进一步深入和发展,其相应的功能也必将会越来越强大,从而为我国科技进步和社会发展贡献出新的力量。
参考文献
[1]张璟,杨红岗,陈皇丹. 基于内容的图像检索技术在网络购物中的应用与发展研究[J]. 农业图书情报学刊,2015,10:37-39.
[2]陈瑞文. 基于内容的图像检索-感兴趣区域的提取[J]. 通化师范学院学报,2014,10:53-55.
[3]顾昕,张兴亮,王超,陈思媛,方正. 基于文本和内容的图像检索算法[J]. 计算机应用,2014,S2:280-282+313.