论文部分内容阅读
随着计算机科学技术的发展,互联网爆发出大量带有丰富信息的多样化数据。随着数据量越来越大,复杂度越来越高,出现了高维空间的数据样本稀疏、计算困难等问题,低维子空间学习因而成为机器学习等领域的研究热点。通过将数据从原始高维流形空间映射到低维子空间中,解决高维空间中存在的问题,使模型得到理想的学习效果是子空间学习的目标。通过多样化的数据采集方式以及不同的特征提取技术,单个样本往往能够从多种不同的角度描述。多种特征是从不同的视角对同一样本的描述,多特征信息对同一样本的描述是一致的,同时多个视角的信息描述彼此之间也是互补的。不同的多视角特征在机器学习的单一特征模型中很难得到较好的学习效果,自然地我们希望通过同时利用整合样本的多视角特征挖掘多视角中有价值的信息来提升模型效果。本文深入研究了当前多视角学习的背景及研究现状,同时具体介绍了子空间学习和多视角学习的相关技术,发现大多数多视角学习技术并不能很好地处理非线性空间的高维特征,针对这一问题本文提出了一种非线性空间中的基于子空间学习的多视角重构保持嵌入方法。本文提出的算法利用当前样本的近邻样本来重构自身,并通过重构权重矩阵来描述样本与近邻样本之间的相似性,同时将这种相似性结构映射到低维子空间中以保持原始流形空间的潜在近邻结构。本文同时构造了一个最优问题使得多视角之间能够互相学习,通过迭代更新的方式求解多视角描述下样本的低维子空间嵌入表示。本文将算法分别应用于文档分类、人脸识别、图像检索等实践应用中,通过与其他多种算法进行对比,给出实验分析以证明本文提出的多视角子空间学习算法的学习效果优于其他对比算法,并且验证了多视角学习方法的实验效果优于单视角学习方法,更加说明多视角学习的研究价值与潜力。