论文部分内容阅读
随着多媒体技术的发展,图像信息应用越来越广泛,人们对于图像等多媒体数据的需求也越来越强烈。图像具有丰富的高层语义,高层语义概念更符合人们对图像的理解,基于语义的图像分类和理解技术便应运而生。在多媒体和模式识别领域相关知识指导下,基于语义的图像分类技术代表着图像理解发展的方向。本文结合支持向量机研究了基于综合特征的图像语义分类方法。本文首先介绍了图像分类技术的发展和研究现状,研究了图像内容的描述方式以及支持向量机的基本原理和核函数模型,为后续的研究提供了理论基础。然后,本文研究了图像综合特征的提取问题。核主成分分析法是一种常用的综合特征提取方法,这种方法的缺点是求解图像特征核矩阵的计算十分耗时,针对这个问题,我们提出了一种基于施密特正交化的核主成分分析法。该方法改进了核主成分分析方法中耗时的特征分解过程,通过施密特正交化核矩阵,避免了原始方法中直接求解特征值和特征向量的过程,具有较低的计算复杂度。实验证明这两种方法提取出的特征与原始特征的均方误差(即波动程度)相差不大,但是改进算法的计算时间明显少于原来的算法。接着本文研究了多类分类器的构造问题,由于支持向量机最初是用于解决二类分类问题的,由此需要一定的策略组合这些二类分类支持向量机。一对一多类分类方法具有训练时间短、错误率低的优点,但是当某些二类分类器分类效果不佳时会严重影响分类性能。针对这个问题,本文引入了交叉验证正确率作为分量分类器的权值,交叉验证是一种基于重采样技术评估分类器的分类正确率和泛化能力的数学方法,因此采用交叉验证正确率作为权值能够保证具有最高分类性能的分量分类器对最终的分类结果作的贡献最大。实验证明改进的算法分类正确率要高于原来的算法。在以上研究基础上,本文建立了一个基于语义的图像分类系统,系统可以提取图像的底层特征和选择支持向量机的参数,主要功能是检验不同条件下的图像分类性能,为前述的研究作出实验结果验证。本文介绍了系统的组成和框架,给出了一些图像分类的实例和实验数据。在实验部分,我们根据实验结果分析了具有较优分类性能的特征表示方法和支持向量机核函数选取方式,采用这些参数能够使得图像分类具有更高的准确率。