论文部分内容阅读
计算机技术和移动拍照技术快速发展,网络空间中的图像信息爆炸式增长。为满足人们对图像的检索,研究人员提出了大量的图像检索算法。图像检索方法可以分为三类,分别是基于文本的图像检索、基于内容的图像检索和基于语义的图像检索。其中,基于语义的图像检索系统中的核心技术是图像的语义标注。本文的重点研究了图像标注的技术问题。研究人员已经提出了大量的图像标注算法,但语义鸿沟问题、维数灾难问题、数据不平衡问题等重要的问题仍然没有从根本上得到解决。针对上述问题,本文基于多标记学习框架,改进了四种经典的机器学习方法用于图像标注,取得了很好的实验效果:1.基于懒惰学习的多标记图像标注算法ML-KNN在计算贝叶斯最大化后验概率时,只使用了主样例与近邻样例在数量上的相关性,没有考虑主样例与近邻样例在距离上的相关性。本文把上述两种相关性同时考虑,提出了一种改进的基于懒惰学习的多标记图像标注算法ML-WKNN。在Image和Yeast两个经典多标记数据集上的实验结果表明,ML-WKNN算法比其它四个经典的多标记算法的总体标注效果更好。2.在基于朴素贝叶斯理论的多标记朴素贝叶斯算法MLNB中,使用主成分分析方法预处理样本的属性特征。处理之后的样例属性之间是不相关的,但是仍然不能满足朴素贝叶斯算法需要属性特征相互独立的要求。本文中我们使用独立成分分析方法来预处理样例的属性特征,处理之后的样例属性特征之间是相互独立的,符合朴素贝叶斯算法对于样例属性特征的要求。在Image和Yeast两个经典多标记数据集上的实验结果表明,IMLNB算法的在多个评价指标上的综合标注效果比其它四个经典多标记算法更好。3.基于改进构建类属属性的思想,本文提出了一种改进的多标记图像标注算法LTFML。LTFML只使用每个类标记的正样例为每个类标记构建类属属性,并使用一种新的评价函数对不同类属属性聚类簇的进行加权。在Image和Yeast两个经典多标记数据集上的实验结果表明,LTFML算法的标注效果在五个评价指标上整体最优。4.针对多标记图像标注中常见的数据不平衡问题,本文对Bagging算法进行改进,提出多标记图像标注集成学习方法BM3。该算法使用Bagging方法对每个类标记的正负样例分别抽取相等数量的样例,然后组成规模相对较小且正负样例完全平衡的训练子集。对基分类器的预测结果集成时,本文使用了一种新的融合策略—最小最大模块化方法。在Image和Yeast两个经典多标记数据集上的实验结果表明,3BM算法整体标注结果比BR等经典的多标记算法的结果更好。