基于子空间学习的多视图聚类方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:happig101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息采集技术的快速发展和计算机存储能力的提高,数据量增长迅速,与此同时,数据内部结构更加复杂,如何在规模庞大和结构复杂的数据当中挖掘出有用的信息为社会的生产生活创造价值是当今大数据时代面临的主要挑战。聚类分析是数据挖掘的基本工具,主要目的是根据样本之间的相似度将数据集划分为若干个子集。针对高维多视图数据集的聚类问题,基于子空间学习的方法由于其具有良好的聚类性能受到广泛关注。近年来,有许多基于子空间学习的多视图聚类方法被提出,但是,这些方法仍然存在一些不足,本文针对这些方法当中存在的不足,利用自适应隐表示、流形正则化、块对角正则和多样性约束等理论对这些方法进行改进,提出两种基于子空间学习的多视图聚类方法,可总结如下:(1)由于传统多视图聚类方法将自适应一致表示的学习和相似度矩阵的学习分开进行,无法得到多视图数据的准确的相似度矩阵表示。针对这一问题,提出基于自适应隐表示的多视图子空间聚类方法,该方法是一种联合学习框架,可以将以上两部分统一到一个目标函数中进行优化,得到更为紧致的聚类结果,在模型中,采用自适应加权的方式自动调整每个视图学习一致表示的重要程度,进一步利用流形正则化方法使隐表示保持原视图内数据的局部几何结构,同时学习隐表示的自表示系数矩阵。由实验结果可知,该方法有效提高了聚类的准确率。(2)针对现有的多视图子空间聚类方法利用特定类型的范数对噪声矩阵进行约束而不鲁棒的问题,提出一种基于块对角分解和HSIC的多视图子空间聚类方法,假设数据集中的各个子空间之间是相互独立的,因此,每个视图对应的理想邻接矩阵的结构应是块对角的,该方法利用块对角正则保持子空间之间的独立性,减弱了噪声异常点数据的负面影响,同时,利用希尔伯特-施密特独立性判别准则计算不同视图的自表示系数矩阵的差异度,充分挖掘出不同视图包含的互补性信息,使整体的自表示系数矩阵全面准确的表达出样本之间的相似关系。实验结果证明了该方法的有效性。本文提出的两个方法分别以学习多个视图的一致性信息和互补性信息为出发点,利用子空间学习的相关理论得到样本集的聚类结果。由实验结果可知,本文提出的两种方法均有效提高了聚类的性能。
其他文献
在我国发展的历史长河中,相继创造了许多文化文明,其中也包括汉语言文学,而且被沿用至今,在中华文化中占有十分重要的地位。随着信息化改革的到来,网络语言逐渐盛行,在这种背
海淀区小学英语主题单元教学设计强调围绕某一意义主题,综合考虑语言、文化、生活、平行学科知识等,以单元任务为载体,整体设计和规划学习进程,使学生借助优质学习资源,围绕
微通道板(Microchannel plate,简称MCP)的性能对像增强器的分辨率、增益、视场质量、暗计数等具有重要影响。表面缺陷是影响MCP性能的主要因素之一,论文分析MCP表面及其缺陷
胡里奥·科塔萨尔(1914-1984),是阿根廷著名作家、翻译家和学者,是拉丁美洲"文学爆炸"代表人物。著作有长篇小说《跳房子》,短篇小说集《游戏的终结》《万火归一》《八面体》
目的:评估与分析冠心病(CHD)PCI(Percutaneous Transluminal Coronary Interruption)术后患者自我损耗现状;构建赋权小组干预方案并验证干预方案对CHD患者自我损耗、自我管理
近年来,随着食品行业对于食品质量要求的提升,食品加工行业逐步开始进行智能化转型,开始应用新型技术来解决生产过程中的产品检测问题;为了检测产线上不规则排布的冰棍的长度,设计了一种新型智能检测工位,并开发了配套算法;在算法开发中,融合了边缘检测及最小外廓拟合算法实现了连续非接触式的产品尺寸测量技术,并在7组238份样例的验证中,得到了低于1.1%的标准相对误差,达到了理想的检测目标。
当前学术界有关语言起源的解释或者观点,基本上都是推测或者假说。我们已经无法从源头上真正探究语言的起源,但是我们能够从婴儿的语言习得中一窥语言产生的奥秘。新生儿的第
近年来,人工智能技术的爆发式增长引发了知识产权学界的关注。在文学艺术领域,部分人工智能的生成物已经在外观上能够与人类创作的作品相媲美。在可以预见的将来,必然会有大量人工智能生成的文学艺术成果进入市场,如何对这些人工智能生成物进行保护、规制,成为了知识产权领域亟待解决的问题。目前,有学者提出狭义著作权、邻接权、反不正当竞争法等保护路径,甚至有学者提出人工智能生成物应进入公有领域的观点。在明确本文的人
经济形势的高速发展让企业对财务管理提出了更高的要求。在传统的财务式财务管理下,财务部门拘泥于事后的核算与分析,与企业的价值创造部门业务部门相对独立。信息系统的发展逐渐瓦解了这种状态,业务部门与财务部门的数据已经打通,但是现存ERP系统下的财务部门仍仅仅负责核算工作,并未有效深入业务前端,管理会计并未有效得到实施。随着《管理会计基本指引》中明确了业财融合的概念,很多企业均开始尝试实施业财融合。业财融
一任何国家,不论是有意识还是无意识,都具有其统治理念,并按照这种理念将其治下的民众纳入一定的序列体系。这就是“身份”或“法的身份”。身份与当时社会中存在的“阶级关
会议