论文部分内容阅读
众所周知,图像中存在纹理、颜色和形状等全局特征以及SIFT和LBP等局部特征,不同视觉特征在表示特定高层语义时所起重要程度不同,正确的特征选择对于图像标注来说具有十分重要的意义。由于这些异构特征之间存在明显的组效应,即同一种类型视觉特征可自然归属为一组(如SIFT特征归属为一组,而颜色直方图归属为另一组),因此可充分利用这种“异构特征成组”先验知识 来加强高维特征表达,使得图像异构特征在表达时能充分利用这种结构性组效应。本文根据图像异构特征之间所存在的结构组效应,对基于组稀疏的高维特征选择方法及其在图像标注中的应用进行了研究。 首先,根据图像异构特征之间所存在组效应,应用组lasso以及Logistic回归构造了适合图像处理的异构特征选择机制(GroupLassowithLogisticRegression,简称GLLR),从而对图像进行标注。此外,从现实世界中所获得数据中提取的高维异构特征往往分布在复杂非欧氏空间且线性不可分,为了将这种线性不可分的数据变得线性可分,以便于分析理解,本文将核学习的方法应用到图像标注中,提出了一种基于组稀疏和多核学习的图像异构特征选择方法(MultipleKernelLearningwithGroupSparsity,简称MKLGS)。由于MKLGS无法对组内的特征进行稀疏选择,为了加强特征的组稀疏效应,本文提出了一种结合组稀疏和组合核学习的图像标注算法(CompositeKernelLearningwithGroupStructure,简称CKLGS)。区别与MKLGS,CKLGS可以同时在特征组内和组间进行选择,使得异构特征的选择更具稀疏性及可解释性。 接着,本文提出了一种结合组稀疏的半监督跨域学习图像标注算法(Semi-supervisedCross-domainLearningwithGroupSparsity,简称S2CLGS),利用目标域中未标注数据的流形结构信息以及辅助域中的标注数据来增强图像标注的性能,在最小化目标域和辅助域的图像分布差异同时,根据图像数据的结构组稀疏特征选择机制,选择最具区别性特征子集,进而训练该语义的分类模型,实现半监督的跨域图像标注机制。该方法的特点在于同时利用了半监督判别分析,跨域学习以及组稀疏结构特性。 随后,本文提出了一种基于非凸正则化因子的组群稀疏方法(NOn-conVexgroupspArsity,简称NOVA),引入非凸的正则化因子使得基于特征组群结构属性的特征选择方法具有连续、无偏差和稀疏等“Oracleproperty”,能够保证特征选择结果的一致性。通过在模拟数据上进行的实验对比,证明了NOVA收敛于正确的模型(truemodel),通过在真实数据集上进行的大量对比实验,本文证明了NOVA优于其他特征选择算法。 最后,本文提出了一种基于非凸组稀疏的多核学习图像标注算法(MultipleKernelLearningwithNOn-conVexgroupspArsity,简称MKL-NOVA),以此来克服高维数据线性不可分问题以及凸正则化因子的选择结果不一致问题。考虑到图像多标注之间的关联性,从压缩感知理论出发,提出了一种基于典型相关性分析和l1-范数的稀疏表达算法来提升基于非凸的多核学习图像标注算法性能。该算法利用典型相关性分析得到多标注之间的关联关系,利用l1-范数正则化因子使预测的标注结果具有稀疏性,即使得相关的标注同时出现。