基于流形正则化和秩约束的多视图子空间聚类方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liqianben
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘和机器学习领域中非常重要的技术。在数据挖掘的许多实际应用中,同一事物的数据可以从不同来源收集,或者使用不同的特征提取方法获得,这样的数据称为多视图数据。传统的单视图聚类方法无法有效处理多视图数据,因此多视图聚类成为许多研究者的关注重点。为了挖掘多视图数据的内在结构,寻求多视图数据的公共表示,实现提高多视图数据聚类效果的目的,本文提出两种基于子空间学习的多视图聚类算法。本文的主要工作如下:首先,本文阐述了多视图聚类的意义以及几种常见的多视图聚类的基本框架,介绍了代表性研究成果并分析了现有方法的优点与不足之处。接着,本文总结了图拉普拉斯矩阵在流形学习方面的用途,分析了传统的单视图子空间聚类的工作原理。然后,本文提出基于流形正则化和秩约束的多视图聚类方法(MRMSC)。MRMSC通过结合子空间学习和基于图拉普拉斯矩阵的流形正则化,将传统的单视图子空间聚类方法推广到多视图数据的场景。通过给公共子空间的拉普拉斯矩阵加以秩约束,以期寻找更加良好的聚类结构。进一步,为了弥补线性模型泛化能力的不足,通过使用核技巧,提出核化的基于流形正则化和秩约束的多视图聚类方法(KMRMSC)。针对上述提出的两种方法,本文设计了相应的优化算法进行求解。最后,在合成数据和真实数据集上,与其它方法进行比较,充分证明了本文新模型良好的聚类效果。综上所述,本文的主要工作成果是:1)本文分析了多视图数据的特点,利用子空间学习、流形正则化和秩约束拉普拉斯矩阵的优点,设计了MRMSC模型来对多视图数据聚类,该方法既能保留各个视图的局部结构,又能获得具有良好的聚类结构的公共表示;2)基于核方法对非线性数据良好的泛化能力,本文使用核技巧设计了KMRMSC模型;3)本文针对提出的两种模型设计了求解算法,分析了其复杂度,通过模拟实验和真实实验证明了提出的两种方法的有效性,并详细分析了两种方法参数敏感性和收敛性。
其他文献
目的:研究大肠癌LS-174-T细胞对三氧化二砷(As2O3)的敏感性和As2O3用于大肠癌临床治疗的可行性及用药方法;并探讨As2O3对大肠癌的抗癌机制。方法:以大肠癌LS-174-T细胞为对象、以H
前言 随着分子生物学技术的进展,血管生成(angiogenesis)成为当今国际生物医学界研究的热点之一。它是一系列生理病理过程中的重要环节,在胚胎发生、炎症、创伤修复和肿瘤发
从2016年起,中小学起始年级的思想品德课统一改为"道德与法治"。新教材增加了法治板块,可以看出国家更加注重中小学的法治教育。然而,当前一些学校初中道德与法治课法治教育
1 引言随着绿色环保和新能源材料成为世界各国竞相发展的目标,钕铁硼永磁电机得到了迅猛的发展和广泛的应用,其关键材料高性能钕铁硼永磁材料发展迅速。烧结钕铁硼磁体的磁N—S
本文是一篇英译汉的翻译报告,报告了作者在翻译《最后的订餐女孩》中所遇到的重难点和解决方法。美国著名西班牙裔女作家丹尼斯·查维斯的《最后的订餐女孩》是一部短篇小说
近年来金樱根被广泛应用于临床,是常见中成药千金片,金鸡胶囊,三金片的重要组成成分。对金樱根药理作用的研究进展进行综述。 In recent years, golden sain root is widely
稀土离子掺杂的上转换发光材料已成为当前的研究热点,其在显示、防伪和生物荧光标记等领域得到了广泛的应用。目前在有关上转换发光材料的研究中,大多数研究人员均采用980nm
据财政部消息,经国务院关税税则委员会审议通过,并报国务院批准,自2019年1月1日起,我国调整部分商品的进出口关税。据财政部关税司有关负责人介绍,为积极扩大进口,削减进口环
差分方程是一种离散的数学模型,主要展现的是一种变化规律,而它的应用由来是源于现实生活中的一些问题,这些问题无法用微分方程或连续的函数进行计算解析,所以就需要将其离散
8月16日,墨子号量子通信卫星升空,一时间,量子技术成为了热点话题。而在量子传感领域,中国航天科工三院33所自主研制的首个基于量子技术的核磁共振陀螺原理样机也于前不久横空问
报纸