基于高阶信息的聚类算法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:huangyi101
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘领域的快速发展促进了聚类问题的研究。但现有的算法,不论是单视图还是多视图的聚类模型,都极大的依赖于点点关系。但这种点点关系并不能充分刻画实际应用场景中的复杂数据的结构信息,且极易被噪声和异常值影响。因此,如何有效的挖掘数据间的关联关系是聚类算法研究中亟待解决的问题。为了缓解这一困境,本文提出了新的度量来建模数据的高阶信息以提升传统聚类算法在真实数据上的聚类性能。本文围绕如何有效利用高阶信息提升算法聚类效果这一目标,针对单视图和多视图数据两种情况展开了一系列讨论与研究,分别设计了基于张量相似度的单视图聚类算法、基于高阶相似度融合的多视图聚类算法和通过自加权高阶相似度融合的多视图聚类算法,其研究成果主要集中在如下几个方面:首先,本文提出了一种基于张量相似度的单视图聚类算法。针对点点关系的薄弱环节,利用四阶张量编码点对间的关联关系,以学习数据的空间结构信息。提出两种张量相似度的构建方式,并分析了它们与传统点点信息的关联,搭建了两者的关系桥梁。在此基础上,将点点关系的学习拓展至高阶信息的提取,并将两者融合以获得准确的聚类效果。最后在模拟和真实数据集上验证了模型的有效性。该方法的提出为建模数据的高阶信息提供了一种全新的思路且将所提出的高阶信息与传统的点点信息进行联系,提升了传统聚类模型的鲁棒性。其次,针对点点关系难以刻画多视图潜在结构的问题,提出了一种基于高阶相似度融合的多视图聚类算法。这种高阶相似性度量利用隐空间结构,挖掘不同维度空间的结构信息,表征不同视图间的内在关联。在此基础上,设计了高阶相似度与点点相似度的共优化聚类模型,学习可靠的隐空间表达。该方法为基于高阶信息多视图聚类模型的研究提供了一种全新的思路,设计了同时优化高阶与传统的点点相似度限制项的聚类模型,融合两者的优势提升了聚类的准确性和稳定性。最后,针对现有基于高阶信息多视图聚类算法稳定性差的问题,提出了自加权高阶相似度融合的多视图聚类算法。模型设计一种可以主动学习的相似性度量来替代依赖视图的相似度,以揭示视图的关键结构。通过引入自加权的高阶相似度限制项,在整合多个视图信息的同时减轻数据中噪声与异常值的影响,从而得到鲁棒的隐空间结构。最后在模拟和真实数据集上验证了提出模型的有效性。综上所述,本文对利用高阶信息挖掘数据间关联关系这一问题进行了深入的研究与讨论。针对单视图数据,提出了一种基于高阶张量的聚类分析算法;针对多视图数据,提出了基于高阶相似度融合的多视图聚类算法并将该方法进一步拓展,提出了自加权的高阶相似度聚类模型以提升模型的鲁棒性。大量的理论分析和实验结果证明,本文提出的一系列模型为基于高阶信息的聚类算法相关研究提供基础理论和研究经验,促进了模式识别和医学图像分割等相近领域的进一步发展。
其他文献
尼龙6(PA6)是热塑性工程塑料中最为重要的品种之一,具有优异的综合性能,广泛使用于许多领域。然而,较低的缺口冲击强度和本质可燃性限制了PA6的应用。作为最通用的热固性树脂之一,环氧树脂同样也有韧性差和易燃的缺点。因此,为拓宽尼龙6与环氧树脂的应用领域,需要对它们进行增韧、阻燃改性。有机硅环氧化合物可以与尼龙6发生扩链反应,提高尼龙6的力学性能,同时将阻燃元素硅引入到尼龙6的分子链上,有望在改善尼
作为增韧聚乳酸(PLA)最经济便利的方法之一,橡胶的加入虽然能提高PLA的韧性,但此过程亦伴随着PLA拉伸强度和模量的大幅度下降。因此,如何在持续提高PLA韧性的同时保持较高的拉伸强度和模量,是实现PLA基材料高性能化过程中亟待解决的问题。同时,单一的高性能材料已无法满足航空、微电子和医疗等领域尖端技术的发展要求。在此背景下,各种敏感材料、形状记忆和自修复材料等智能材料应运而生。基于此,本文期望通
海洋生物在水下设施表面附着生长而逐渐形成的生物垢,称之为海洋生物污损,它对海洋运输业和海洋资源开发造成严重危害。目前,基于水解性聚丙烯酸酯的自抛光防污涂层(SPCs)是应用最广的海洋防污材料,然而其表面自更新依赖于水流冲刷,静态防污能力不佳。此外,这类聚合物主链不降解,水解后的聚合物在海洋中形成微粒,对海洋生态不利。本论文通过分子设计制备了功能性主链降解-侧基水解(双解)高分子防污材料,研究了其化
在众多的磁性材料中,非晶/纳米晶合金由于其优异的磁学性能而在科学与技术应用领域引起了越来越多的关注。不论在基础研究还是在实际应用方面,都取得了巨大的进步。在基础研究方面,从磁学理论知识的深入研究,到成分设计原则的探索,已经为非晶/纳米晶合金的实际应用奠定了良好的基础;在实际应用方面,从工艺优化到新技术的开发,使非晶/纳米晶合金的应用范围越来越广泛,已经有众多的非晶/纳米晶合金被应用于变压器、传感器
由于肿瘤复杂的生理环境和体内多重生理屏障,纳米药物需要经历体内循环、肿瘤富集渗透、细胞摄取和药物释放等过程,导致其递送效率不佳。如何提高药物的递送效率是药物载体领域的重要科学问题,也是提高纳米药物抗肿瘤疗效的关键所在。针对这一难题,本论文针对所递送药物的靶点不同,结合肿瘤酸度响应的高分子载体材料的设计与合成,构建纳米载体提高抗肿瘤药物递送至靶标的效率。本论文主要研究内容包括如下两部分:1.细胞核是
随着数字相机和智能手机等成像器件的普遍应用,高质量低成本的数字图像成为信息交流中重要的载体,被广泛应用到安防监控、医疗辅助、犯罪追踪等多个领域。然而,在图像拍摄过程中,所拍摄的物体与成像设备之间难免出现相对运动、景深变化等情况,容易导致图像运动模糊。由于图像的质量对后续图像数据的分析与理解至关重要,能够从运动模糊图像中恢复出对应清晰图像的运动模糊图像复原问题受到了广泛的研究关注。目前大多数的运动模
有机太阳电池(OSC)以其质量轻便、可挠折弯曲、可溶液加工以及低成本的优势得到了广大研究者们的青睐。得益于非富勒烯受体材料的迅猛发展,有机太阳电池的光电转换效率(PCE)已经突破了18%。但是目前大部分活性层体系的最优性能都是在膜厚100 nm左右获得的,随着膜厚的增加,器件的效率会呈现出一定程度的下降。这种情况将非常不利于大面积卷对卷印刷生产,因此发展高效率的厚膜活性层是非常必要的。本论文以实现
Ti微合金高强钢是一种低成本高性能的新型钢铁材料,其强度的稳定控制问题一直是该领域的一个重要课题。随着炼钢技术的进步,钢的成分波动问题已基本解决,而纳米碳化物析出对TMCP工艺参数敏感所引起的性能波动问题仍十分突出。如何充分发挥纳米碳化物析出强化效应和稳定控制其析出是开发Ti微合金高强钢的关键。本文在低碳钢(简称C-Mn钢)基础上添加微量的Ti和Mo元素,设计出低碳Ti钢和Ti-Mo钢。采用热模拟
近年来,随着污水处理率逐年升高,污泥的产量也在大幅增加,必须实现污泥减量化,降低污泥含水率,才能减少其后续的处置成本。污泥脱水困难的原因主要在于其成分复杂、有机质含量高以及胞外聚合物(EPS)形成的网状结构中包裹的细菌和吸附的水分子形成氧化膜,使得污泥胶体的表面水合程度过高并且固液分离困难。本文以EPS含量差异较大的市政污泥和造纸污泥为研究对象,通过对比研究,探索了EPS对污泥深度脱水性能及水分迁
院校名片2017年7月,陆军工程大学以原解放军理工大学、军械工程学院主体和重庆通信学院、武汉军械士官学校、工程兵学院为基础调整组建,是我军人才培养与科学研究并重、工程技术与作战指挥融合的教学研究型综合性大学。800万获得2018年度国家最高科学技术奖后,钱七虎院士将800万奖金全部捐出用于资助西部和少数民族贫困学生上学。2019年3月16日,
期刊