论文部分内容阅读
随着信息技术的不断发展,多视图数据受到了越来越多的关注。近些年来,研究人员提出了一些针对多视图数据的聚类算法,比如,基于谱聚类的多视图聚类算法,基于K均值聚类的算法,基于子空间的多视图聚类算法等等。另一方面,对于单视图数据,已有研究表明,有效利用实例和特征之间的对偶性,即对实例和特征进行联合聚类,可以提升聚类效果。本文首次将实例和特征的对偶学习引入多视图数据场景中,提出了一个新的多视图联合聚类方法,具体贡献包括: 引入三元非负矩阵分解来建模多视图数据实例和特征之间的对偶性,并在此基础上提出了我们的鲁棒多视图联合聚类算法。首先,让各视图共享一个实例划分系数矩阵,该系数矩阵作为一个中间桥梁将各个视图进行关联。第二,在各个视图中采用图正则的方法来刻画和保持数据的近邻局部结构。第三,实际数据很有可能包含噪声或异常点,对此,在模型中使用具有鲁棒性质的l21范数来度量模型的损失。提出了一个有效的优化算法来对模型进行求解,并证明了其收敛性。 在9个常用的多视图数据集上进行实验来验证模型的有效性,并使用3种经典的聚类评价指标(聚类准确性、归一化互信息和聚类纯度)评价聚类结果。实验结果显示,方法的聚类效果优于现有主流的多视图聚类方法。 实现一个具有可视化功能的多视图聚类分析工具原型,该原型提供了友好的用户界面,支持用户选择聚类方法、数据集以及视图组合,并以图形的形式直观地展示聚类结果,帮助用户方便、快捷地理解数据。