多视图数据的聚类算法研究与应用

来源 :江南大学 | 被引量 : 0次 | 上传用户:goooooooal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种较为成熟的无监督分析方法,聚类分析已经被广泛运用于数据挖掘、模式识别、图像分割等研究领域。但目前普遍存在的传统聚类方法大多仅基于单一视图数据进行研究,而在数据挖掘和分析的诸多实际应用场景中,各个独立视图数据之间具有互补信息以及一致信息的多视图现象已经广泛存在。此外,在数据爆炸的今天,如何更好的处理大规模高维数据也已成为一个亟需解决的问题。为此,本文着重于研究面向多视图情景的大规模数据的聚类算法,利用多个视图数据之间的异质性以及其存在的潜在联系来获得更加完备的数据底层结构信息,从而提升聚类算法的精度,同时利用地标点采样等技术来提升多视图聚类算法的效率,并将改进的算法应用到具备多视图结构的复杂网络社区发现领域,主要的研究内容包含以下三方面:(1)针对传统的多视图子空间聚类算法大多仅聚焦于浅层聚类,无法充分捕捉到数据的深层结构信息,同时没有在数据的自我表征层面进行深入研究的问题,提出一种引入了排他性约束的深度多视图子空间聚类模型。该模型在每个视图上利用深度自编码器进行非线性低维子空间映射,以捕获原始数据的深层结构。将排他性约束引入到位于多个视图数据中间层的自表示矩阵中,以更好地保留多个视图的局部特性,从而使利用潜在特征获得的多视图共识自表示矩阵能够兼顾多视图数据的互补性以及一致性。利用联合学习框架使自编码器参数和聚类参数迭代更新以提高聚类性能。在多视图数据集上的仿真证明该方法能够更好地挖掘出多视图数据的底层互补结构从而提升聚类精度。(2)针对目前存在的多视图聚类方法大多是对聚类准确性进行研究而未着重于提升算法效率,从而难以应用于大规模数据的现象,提出了一种结合地标点和自编码的快速多视图聚类算法。该模型利用加权Page Rank排序算法对每个视图的样本点进行权重分配,进而择取出每个视图的地标点,以降低数据规模。使用凸二次规划函数从数据中直接生成各个视图的独立相似度矩阵,将具有低存储开销性能的多视图共识相似度矩阵输入自编码器以替代拉普拉斯矩阵特征分解,从而降低算法计算复杂度,使算法能适用于具备大规模性质的多视图数据集。在多视图数据集上的仿真证明了该算法在运行效率上的优越性。(3)为了解决同时具备大规模性质和多视图性质的复杂网络的社区发现问题,基于前面所涉及的地标表示及相似度矩阵的构造方案,一种基于深度类自编码非负矩阵分解的后融合多视图社区发现算法被提出。受深度自编码器和非负矩阵分解模型启发,该模型将单层映射的NMF模型转变为包含编码层和解码层的多层映射NMF模型,以学习到更好的低维网络特征表示,从而获得更精确的多视图独立社区结构。在类划分空间层次对多个视图进行网络结构融合,并引入视图权重以保留多个视图网络的参差性,从而增强捕获到的数据的完备性。此外,为了使模型能够适用于具备大规模性质的复杂网络,将加权Page Rank方法引入每个视图网络中以进行地标点择取。在多个具备多视图结构的复杂网络上的仿真表明,所提出的算法能够获得更加真实的社区发现结果。
其他文献
由于图像采集技术的应用和互联网、物联网技术的发展,人们可以很方便地在电脑上或手机上制作和分享视频。最近几十年,由于越来越多的人参与到视频的制作和分享过程中来,造成每天有海量的视频被上传到互联网上,这使得互联网上的视频数量呈现指数级的增长趋势。这些视频的内容种类繁多,有新闻视频、影视视频、监控录像、视频日志(vlog)等。种类繁多的视频数据,既丰富了人们的社交生活,也极大地拓宽了人们获取各种信息、了
学位
根据最新的《2022中国幽门螺杆菌感染治疗指南》和《幽门螺杆菌感染的处理:MaastrichtⅥ共识报告》提供的治疗策略,幽门螺杆菌感染的首选方案仍为铋剂四联方案。钾离子竞争性酸阻滞剂可替代质子泵抑制剂用于铋剂四联方案。高剂量双联方案疗效与铋剂四联方案相同。部分中药、益生菌可提高铋剂四联方案根除率、减少不良反应。三联方案联合胃黏膜保护剂无法替代铋剂四联方案。
期刊
报纸
Ti-Mo合金具有较高的比强度、较低的弹性模量、良好的耐蚀耐磨性和优异的生物相容性等特点,非常适合用于制造骨科植入体。但是,Ti-Mo合金表面具有生物惰性,植入人体后难以与自然骨形成强有力的骨性结合,在长期服役过程中容易松动或脱落。羟基磷灰石(HA)是一种高生物活性陶瓷材料,但因较差的力学性能而难以应用于高承载部位。本文基于复合材料的设计思路,将力学性能良好的Ti-Mo合金和生物活性优异的HA陶瓷
学位
目的 比较10 d与14 d疗程含铋剂的四联疗法根除幽门螺杆菌的疗效。方法 研究对象为因胃肠道症状于厦门大学附属第一医院思明院区13C呼气试验阳性的患者168例,随机分为A、B 2组,每组84例,均给予含铋剂的四联疗法(艾司奥美拉唑镁肠溶片20 mg Bid、枸橼酸铋钾片0.6 g Bid、阿莫西林胶囊1 000 mg Bid、呋喃唑酮片100 mg Bid),治疗时间分别为10 d、14 d。疗
期刊
近年来,切换线性系统的控制理论与应用渐趋完善,但切换非线性系统的控制问题仍然存在许多具有挑战性的问题。在实际应用中,切换非线性系统是一类普遍存在的系统,主要由多个切换非线性子系统与切换规则组成。切换非线性子系统呈现非线性特性,切换规则产生离散动态,其复杂的动态特性使得传统的连续控制与离散控制应用于切换非线性系统时不能实现理想的控制效果。本文基于混杂系统理论对两类重要的切换非线性系统的控制问题展开研
学位
目的:观察健脾消癌方对结肠癌肝转移荷瘤裸鼠肝组织中程序性死亡受体-1(PD-1)/程序性死亡配体-1(PD-L1)及微小RNA200c(miRNA-200c)/转录因子E盒结合锌指蛋白1(ZEB1)表达的影响。方法:在50只裸鼠中随机抽取10只作为假移植组,另取40只建立结肠癌肝转移模型。造模成功后再将其分为4组:模型组,健脾消癌方低、中、高剂量组(简称为低、中、高剂量组),每组各10只。假移植组
期刊
近年来,未到期出资转让作为公司法的研究热点备受人们关注。近日,《中华人民共和国公司法(修订草案)》再次对《公司法》的相关规定进行了调整,根据草案第89条的规定,未到期出资股东转让股权的,由受让人承担缴纳该出资的义务。相比于2013年公司法在未到期出资转让责任承担上的立法空白,草案的这一做法存在进步之处。遗憾的是,草案的这一规定并没有使未到期出资转让的问题得到体系性的解决。在未到期出资转让中,法院对
学位
当前分拣领域中,借助机器视觉控制抓持器,识别抓取某一类位姿固定的物体的技术已相当成熟。但当物体的属性发生改变时,不仅容易造成抓取失败,可能还需更换末端执行器以适应新的目标物体,因此亟需一种机械手抓取范围可变同时识别定位能力较强的抓取方案。故本文以该抓取方案为研究目标,通过设计变位机械手来增加抓取范围,通过对双目视觉的研究和立体匹配算法的改进来实现更好的匹配效果,再利用基于深度学习的目标检测算法来提
学位
中国是幽门螺杆菌(Helicobacter pylori,H.pylori)感染的高发地区,H.pylori对常用抗生素的耐药率高。初次治疗失败将导致耐药形势愈加严峻,增加再次治疗的难度。因此,初次治疗选择H.pylori高效根除方案至关重要。铋剂四联疗法因具有高效、安全、可提高耐药菌株的根除率的特点,已被作为我国一线H.pylori根除治疗的首选方法。临床医师应根据各地区患者抗生素耐药特点选择敏
期刊