基于三元非负矩阵分解的鲁棒多视图联合聚类方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:zhongtianlang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,多视图数据受到了越来越多的关注。近些年来,研究人员提出了一些针对多视图数据的聚类算法,比如,基于谱聚类的多视图聚类算法,基于K均值聚类的算法,基于子空间的多视图聚类算法等等。另一方面,对于单视图数据,已有研究表明,有效利用实例和特征之间的对偶性,即对实例和特征进行联合聚类,可以提升聚类效果。本文首次将实例和特征的对偶学习引入多视图数据场景中,提出了一个新的多视图联合聚类方法,具体贡献包括:  引入三元非负矩阵分解来建模多视图数据实例和特征之间的对偶性,并在此基础上提出了我们的鲁棒多视图联合聚类算法。首先,让各视图共享一个实例划分系数矩阵,该系数矩阵作为一个中间桥梁将各个视图进行关联。第二,在各个视图中采用图正则的方法来刻画和保持数据的近邻局部结构。第三,实际数据很有可能包含噪声或异常点,对此,在模型中使用具有鲁棒性质的l21范数来度量模型的损失。提出了一个有效的优化算法来对模型进行求解,并证明了其收敛性。  在9个常用的多视图数据集上进行实验来验证模型的有效性,并使用3种经典的聚类评价指标(聚类准确性、归一化互信息和聚类纯度)评价聚类结果。实验结果显示,方法的聚类效果优于现有主流的多视图聚类方法。  实现一个具有可视化功能的多视图聚类分析工具原型,该原型提供了友好的用户界面,支持用户选择聚类方法、数据集以及视图组合,并以图形的形式直观地展示聚类结果,帮助用户方便、快捷地理解数据。
其他文献
Web Services技术为异构、自治和松散耦合的分布式应用提供了一个交互机制,已成为一种新的应用模式和分布式计算模型。为满足功能更复杂、更强大的实际应用的需要,动态的按需
现代信息科技的进步特别是网络技术的飞速发展,已经使得人们的日常工作与网络密不可分,大量的数据文件需要存储和共享,使用传统的服务器式存储和共享技术会给服务器造成巨大
  本文研究了人体运动分析系统的一个子系统:人体运动检测与跟踪,它是人体运动分析与识别的基础。本文的主要工作可以归纳如下:  在第二章中本文基于背景差分的基本原理,针对
由于面向对象数据库(OODB)仍然不很成熟,关系数据库(RDB)还是存储数据必不可少的一种方法.因为这两种模型是基于不同的范式,所以使得匹配对象模型到关系模型数据库过程还是一
本文首先对当前软件可测试性方法与技术进行了系统分析,接着从提高软件可测试性角度,对软件故障分布规律、软件开发模型、软件可测试性度量方法、软件可测试性设计方法、软件
本文通过对用户查询行为的分析,并结合已有的一些研究成果,提出了一种建立用户查询结果缓存的策略.在分析了一般缓存机制的分类、置换方法、更新方法后,建立了与搜索引擎相适
Petri网是一种适宜描述和研究分布式、异步、并发现象的系统工具,已经在计算机网络、通讯系统、计算机体系结构、分布式系统、电路设计与验证、生产过程控制、自动化制造系统
随着社会的进步和科技的发展,人们生活的水平不断提高,对于身体健康和各种疾病的关注也越来越多,有效的早期诊断方法和设备成为热点.脉搏是人体活动最重要、最灵敏和最可靠的
随着计算机和网络技术的飞速发展,计算机网络被广泛的运用到政治、经济、军事、科技等各个领域.基于网络的各种应用也越来越多.本课题结合我军某些单位工作实践的需要.采用基
异常检测是保障计算机安全的一个重要方法.本文丰要研究应用于异常检测的各种基于阴性选择机制的免疫算法.此类算法的丰要特点是仅根据正常的数据就能训练出覆盖所有异常特征