多视图重叠聚类研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:zy15400444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
"互联网+"这一新生态的提出,让数据走进了我们日常生活的方方面面。从这些无所不在的数据中提取出有用的信息,就是数据挖掘(DataMining)技术的研究内容。聚类分析是在没有任何先验信息的情况下,发现数据中潜藏的结构或者模式的过程。随着大数据时代的到来,聚类的研究对象——数据发生了质和量的变化。基于实际应用的需要,聚类分析技术又有了许多新的研究方向,如聚类集成、半监督聚类、重叠聚类、多视图聚类等。重叠聚类是在聚类过程中允许对象划分到多个簇中,其能发现数据中潜藏的重叠信息,这些重叠信息通常为在实际应用中起到桥梁或枢纽作用的关键点,具有较高的分析价值。多视图数据从不同的角度或者多种不同的信息源对同一事物进行描述,构成具有属性分割的数据,这也正是多视图聚类的研究对象。大多数重叠聚类算法致力于研究如何发现重叠聚类算法,而忽略了重叠对象与其所属的不同簇之间的相关性差异。针对这一点,本文提出了一种基于相关权重的重叠聚类算法,该算法在对数据进行多分配时,考虑对象与聚簇之间的相关权重,从而提高划分质量。在多标签学习、电影推荐等多个包含重叠信息的重叠数据集上的实验表明,与其他重叠聚类算法相比,基于相关权重的重叠聚类算法具有较好的聚类效果。由于有些多视图数据也存在数据重叠,本文在基于相关权重的重叠算法的基础上,提出了一种适用于多视图数据的重叠聚类算法。多视图数据的重叠信息可能存在于视图内,也可能存在于视图之间,因此我们认为各个视图上的聚簇结构是有差异的。该算法将样本损失函数和聚簇结构损失函数之和作为目标函数,通过引入共识聚簇结构实现多个视图上的聚簇结构进行约束和融合,最终得到一致性划分结果。实验表明,本文提出的适用于多视图数据的重叠聚类算法能够发现多视图数据中隐藏的结构,并且具有较好的收敛特性。
其他文献
作文教学是中学语文教学的重要组成部分,是培养和提高学生在日常学习和工作中所必须的具备的一般的写作能力的重要手段.然而现实的作文教学中,很多现象不尽人意,学生感到很困
期刊
数字水印技术能将表明所有者身份的版权信息嵌入到数字产品中,以达到版权保护与内容认证等目的。因此,数字图像水印技术已成为当今的一个研究热点。本文针对数字图像内容认证的
机会网络(opportunity network)是近年来出现的新型网络,它不同于传统的移动自组织无线网络,节点移动、信号衰减、网络稀疏等因素造成节点在某一个较短的时间片内没有端对端的
互联网协议解析还原系统是对互联网络现行的应用层服务进行深度解析的软件。在当今互联网业务日益增大,互联网安全问题受到了严峻的挑战。目前,如何能够正确、高效地还原出互联
本论文主要研究了一种宽频带、低杂散的Ka频段上变频系统,该系统是卫星通信中不可缺少的组成部分,整个系统旨在实现140MHz信号到Ka频段的无失真的频谱搬移。在结合系统指标情
作为5G移动通信系统的一个标志性的技术,非正交多址接入技术对5G系统的用户容量、频谱效率和数据速率都有重大影响。与功率域非正交多址接入技术 NOMA(Non-Orthogonal Multip
随着网络基础设施的发展和移动设备的普及,在线视频流量增长迅速,在网络流量中占比越来越大。在线视频具有时变性,高峰期带来的网络流量远大于低峰期网络流量,如果满足高峰期
语音识别的一大难点就是识别系统在噪声环境下性能大幅下降,人耳具有良好的抗噪能力,如何让识别系统能像人耳一样具有选择性,建立符合人耳听觉特性的听觉模型是长期以来广大研究
中国设备管理协会与中国制冷空调工业协会于2008年1月23日发布指出,根据中国设备管理协会、中国制冷空调工业协会
近期由Candes、 Romberg、 Tao和Donoho等人提出的压缩传感(Compressed Sensing, CS)理论,可以从一个非适应性、线性测量中恢复稀疏或可压缩信号。如果选择适当,测量数目可以