论文部分内容阅读
随着多媒体技术的发展和互联网的不断普及,数字图像已得到了越来越广泛的应用。20世纪90年代以来,为了有效地组织和检索海量图像数据,满足人们日益增长的图像检索需求,出现了基于内容的图像检索技术,并逐渐成为了图像检索技术发展的主流方向。现有基于内容的图像检索技术在描述图像内容时大多直接采用了颜色、纹理、形状等低层图像特征,这些传统的特征描述方式一般直接以统计数据的形式出现。而事实上,这些统计数据与人对图像内容的理解存在很大的差异。人对图像内容的理解并不建立在统计的基础之上,并且图像内容具有“模糊”特性,无法简单的用特征向量进行表示。这就造成了现有系统中必然会存在图像表示与人的理解偏差的问题,即语义鸿沟问题。很多情况下,仅仅使用图像的低层特征作为检索依据,其结果不尽人意。因此,如何描述图像,使其尽可能的符合人对图像的理解,成为提高检索精确度的关键。从人对事物认知的角度看,人对图像内容的理解和描述主要在语义层次上进行。如何缩小“语义鸿沟”,如何准确表达图像的内容语义和用户的检索意图,成为了图像检索技术研究的重点和关键。本文在图像特征索引的基础上,引入了模糊语义分类方法和相关反馈方法,着眼于图像特征与语义概念间的映射,初步探索了特定场景下低层特征与高层语义间的映射方法,主要的工作有:1.运用物理特征提取算法,提取图像颜色、纹理和形状特征,用于后续的语义映射。图像的物理特征是计算机理解图像内容的基础,良好的特征提取算法,能够提高后续语义映射的准确程度,进而最终改善系统检索的效果。2.运用模糊分类方法,建立低层特征与高层语义间的映射。要进行基于语义的图像检索,首先需要提取出图像语义概念。在现在的计算机及模式识别技术条件下,对图像语义概念的提取,应该建立在对图像目标识别的基础上。通过模式识别的方法,识别出图像中的目标并与语义概念进行连接,这样,就可以使低层物理特征映射到高层语义特征,实现对高层语义的检索。本文引入了模糊分类的方法,通过选择最佳训练样本,实现物理特征向语义的映射。同时,模糊集合的使用,使使同一幅图像可以同时隶属于不同的语义类别,这也更加符合人对事物的认知方式。3.运用基于语义分类的相关反馈方法,引入用户对语义概念的理解。用户可以通过判断系统检索结果与自己检索预期之间的差异,分别选择能够准确表达检索意图和不能表达检索意图的图像,进行相关反馈,对图像对应语义进行修正,更好地表达用户对概念的理解,减小样本选择者的主观性。同时通过用户的反馈,可以降低物理特征相似但语义无关图像对语义概念的隶属度,使检索结果更加准确。