论文部分内容阅读
人们对图像的认识是利用自己的先验知识来推理图像语义的过程,这样很容易产生图像的底层视觉特征与高层语义之间的“语义鸿沟”。如何从反映图像内容的低层视觉特征中提取出隐含的、预先未知的高层语义,来弥补这种“语义鸿沟”问题,是极为重要的工作。当前图像语义提取过程仍离不开图像的低层特征,往往是通过构造从低层特征到高层语义之间的映射来实现语义特征的提取。本文将粗糙集理论引入到图像的语义底层特征提取中,并通过支持向量机(SVM)对最终选取的有效底层特征集进行了验证。在图像底层特征语义提取研究中,常常因存在着过多特征而产生很多的冗余,而且有时会把有用的主要分类特征淹没在大量无用特征之中,造成所谓“特征维数灾难”。因此如何对底层特征进行准确的描述,剔除不良特征,是图像语义提取工作中面临的另一个问题。例如针对自然景观类图片能否快速有效地找出一组最有效特征来取代原有的特征表示方法,是图像识别中一个至关重要的问题。在现有的图像语义底层特征提取研究中,主要抽取如颜色、纹理、形状或者它们的组合特征等信息来表征图像的语义内容。这些特征可以独立、客观地直接从图像中获得信息。典型的特征提取法穷举法、分支定界法、遗传算法、主成分分析法等主流算法,但是这些方法都没有把知识系统与分类紧密的联系在一起,不能够发现和推理各个数据特征间的关系,也不能用条件属性和与之对应的属性值来描述集合中元素的附加信息,因此难以发现抽象对象中的分类能力,揭示出彼此规律。本文首先分析了有关语义层次的模型,并且介绍了提取图像语义的一些常用方法。在单独分析了图像的颜色、纹理、形状等特征的基础上,将粗糙集引入到有效底层特征集的选取中。本文重点研究了粗糙集理论的约简算法在图像语义提取中的应用。通过结合粗糙集理论的约简算法,把知识约简的思想应用到图像语义特征提取中。决策表表示一种特殊而且重要的知识表达系统,通过构建决策表,在分类不受影响的前提下对属性进行约简,可以有效的降低SVM训练样本的维数。最后,在约简的基础上,利用优化算法通过对SVM进行核参数的优化,使得语义识别率达到一个较高水平。由于粗糙集只能处理概念类或定性数据的对象,因此,在知识约简前本文先利用K均值聚类算法对其进行离散化处理。本文拟通过粗糙集对样本特征的约简,找出最有利于图像语义识别的有效特征,提高图像语义分类的准确度和效率,最后用SVM(支持向量机)方法验证了本方法所提取的语义底层特征的有效性。