论文部分内容阅读
以计算机技术、微电子技术和通信技术为特征的现代信息技术的发展带来了越来越多的多媒体数据。由于图像信息内容丰富、表现直观,一直是人们非常重要的信息获取来源。如何从海量图像信息中检索出需要的图像,以满足人们的不同需求,已成为研究者重点关注的问题。早期基于文本的图像检索,因主观性和不确定性等缺陷已无法满足人们需求。基于内容的图像检索技术依赖于图像的低层视觉特征,与人们理解的图像高层语义之间并没有直接的联系。如何突破图像低层视觉特征的限制,跨越低层特征与高层语义之间的“语义鸿沟”,实现语义层次上的检索,已成为图像检索领域研究的热点与难点。论文概述了图像处理的基础知识,介绍了图像检索技术的发展状况及主要研究内容,分析了现有的图像检索技术的优缺点,引入了图像语义的概念,论述了图像语义中的热点及关键问题,提出了论文研究的重点-高效图像语义提取方法。论文首先研究了基于SVM的图像语义分类方法,选取不同的低层视觉特征作为特征组合,并使用不同核函数将图像从低维特征空间映射到高层语义空间,以解决低层特征与高层语义之间的“语义鸿沟”。仿真结果发现,基于SVM的图像语义分类方法具有较高的分类准确率,最高可达到84.5%。SVM在假设空间中寻找最接近实际分类函数的单个分类器模型,无法结合多个分类器,性能提升空间有限。为了更好地建立图像低层特征和高层语义的联系,有效提升图像分类性能,论文研究了集成学习的图像语义分类方法,提出了基于Bagging和Adaboost算法的两种集成学习分类方法。根据不同原则选取训练子集并构建各自的基分类器,然后采用不同的集成策略将基分类器形成组合分类器以实现图像分类,最后分析了不同集成学习方法的分类性能的优劣。仿真结果表明,集成学习方法能有效提升弱学习器的分类效果,基于Bagging算法的分类准确率可达到87%,Adaboost算法的分类准确率可达到89.5%,由于对错分数据的训练更具有针对性,且对效率高的子分类器赋予较高权值,基于Adaboost算法的集成学习方法更适合于图像分类。最后对本文研究工作进行了总结,指出了下一步研究的方向。