论文部分内容阅读
随着互联网信息技术的发展,数据成为人们生产活动和社会生活的重要组成部分。由于互联网时代产生了海量的数据,导致其会呈现出高维和多态的现象,因此人们迫切需要寻找一种高效的数据分析工具来协助理解数据中的含义。然而,传统数据分析方法难以实现高效分析与处理。认知生理学研究指出大量高维数据具有内在的低维结构。非负矩阵分解(Non-negative Matrix Factorization,NMF)能够挖掘这种低维结构和学习数据中的局部表征,通过将天然非负样本从高维空间映射到低维空间中,有效保留了数据的低维主体,协助人们理解数据中的深层含义,其被广泛应用于机器学习、模式识别、信号处理等多个领域。然而,当前多数非负矩阵分解技术只针对单一数据集(视图),易受单一视图信息不足的影响,而难以在某些应用上取得令人满意的性能。研究人员指出,通过多种不同角度对同一对象进行观察,能够提供单一数据集不具备的互补信息,并结合多视图数据间的兼容性突破单一视图的信息瓶颈。多视图学习是单视图学习的有效拓展,旨在综合各视图信息以弥补单视图的不足,进一步提升聚类等高层应用的性能。首先,本文阐述了非负矩阵分解算法和多视图聚类算法的意义,对其研究现状做出了比较全面的综述;同时,本文简要介绍了非负矩阵分解的几种常见变体及相关原理,以及基于非负矩阵分解的多视图聚类算法和后期特征融合的方法。其次,本文重点研究非负矩阵分解在多视图学习的应用,提出了基于深度非负矩阵分解的多视图聚类(Multi-view Clustering based on Deep Non-negative Matrix Factorization,Mv DNMF)和深度图约束非负矩阵分解的多视图聚类(Multi-view Clustering based on Deep Graph Regularized Non-negative Matrix Factorization,Mv DGNMF)两个模型。Mv DNMF和Mv DGNMF两者具有深层结构,挖掘了单层非负矩阵分解无法提取的深层隐藏信息,并融合了多个视图的互补信息,有效提升了聚类性能;此外Mv DGNMF还有效缓解了多层非负/半非负矩阵线性组合存在的可解释性差和表征过于抽象的问题。通过构造图Laplace正则化的多层非负矩阵分解模型,Mv DGNMF可以提取更抽象的表征,利用样本数据之间的相似性提升各层信息传递的效率,并将各单一视图的末层表征趋向于一致。针对Mv DNMF和Mv DGNMF模型,本文设计了基于交替方向乘子法的优化算法。最后,为进一步验证Mv DNMF和Mv DGNMF两种方法的有效性,本文使用了多个真实多视图数据库(包括图像和文本数据集)对其进行评估。通过与其他前沿的方法的性能比较,验证了本文Mv DNMF和Mv DGNMF算法的良好性能。