论文部分内容阅读
随着互联网技术的发展,子空间学习已经成为机器学习、数据挖掘、模式识别等领域的研究热点。高维数据难以使模型得到理想的学习效果。子空间学习旨在通过计算高维空间中样本间的关系,并保持该关系将样本映射到低维子空间中。由于数据的采集方式不同和多样化的特征提取算法,描述数据的角度逐渐增多。不同特征在机器学习和数据挖掘模型中学习效果也不尽相同。使用单一特征的模型很难得到较好的效果。多视角学习是一种同时利用多个视角下的特征提升模型效果的方法。本文针对多视角子空间学习方法展开研究,并提出了一种多视角的局部子空间学习算法以提升子空间学习的效果,本文的主要工作如下:(1)叙述了多视角学习的背景,意义和国内外研究现状。对多视角学习的三类主要方法:协同训练方法,多核学习方法和子空间学习方法的算法思想和主要进展进行了介绍。(2)对子空间学习和多视角学习的主要技术进行了详细的介绍。重点阐述了本文中所涉及到的局部线性嵌入、拉普拉斯映射和多视角学习中的协同训练多视角谱聚类和协同正则化多视角谱聚类。(3)局部线性嵌入算法是一种经典的子空间学习算法,但是该算法容易受噪声数据的影响,此外邻域参数的选取对算法的结果也有较大的影响。针对该问题,本文提出了一种鲁棒的局部线性嵌入方法。该算法通过使用L2范数对相似度矩阵的复杂性进行惩罚并利用L1范数保证矩阵的稀疏性实现对相似度矩阵的自适应求解。本文同时考虑多视角学习的一致性和互补性原则,通过数据间的一致性对噪声数据产生的影响进行修正,获得统一的鲁棒相似度矩阵,并使用该矩阵进行子空间学习,提升子空间学习的效果。本文给出了多视角局部子空间学习算法的迭代解法,并利用辅助函数法对解法的正确性和收敛性进行证明。本文在手写体,人脸,物体等多种数据集中使用多视角局部子空间学习与其他多视角等算法进行对比,并给出了实验分析以证明多视角局部子空间学习的效果。(4)图像检索是学术界研究的热点问题之一,特征提取的效果对图像检索系统尤为重要,由于互联网图像的复杂性和多样性,单一特征难以取得较好的效果,本文使用多视角子空间学习技术对多种图像特征进行融合并应用到图像检索中,实验表明本文的算法有着较好的效果。