面向多视图聚类的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:luyong1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,数据呈现出多视图的特点,尤其是单视图数据不能全面描述所有实例的信息。因此综合利用多个视图来全面和准确地表示数据是很重要的。多视图学习已经成为计算机视觉、人工智能等领域广泛研讨的热门话题。作为多视图学习的一个主要的研究范畴,多视图聚类在最近十几年里得到了迅速的发展,而且取得了巨大的技术提升,也因此得到了人们普遍的重视。其中,基于子空间的聚类试图在低维特征空间中搜索数据的最优聚类结构。然而,受制于各个视图之间存在的多样化以及异构化信息,现有的大多数多视图子空间聚类方法无法全方位地捕获原始高维数据之间的关键信息,也不能准确度量不同视图数据对聚类结果的贡献程度,使得最终的聚类结果的准确性以及稳定性大大下降。基于以上问题,本文重新挖掘了不同视图数据之间的互补信息以及共识信息,并深入探讨了鲁棒的多视图子空间聚类方法。本文的整体内容如下:针对现有的子空间聚类方法无法捕获不同视图数据间的多样化信息的问题,本文提出了基于正交多样化的鲁棒多视图子空间聚类算法。该方法通过使用新定义的正交性项巧妙提高了多视图数据间的多样性,有效降低了学习子空间表示的冗余度,提高了聚类精度。同时,基于图嵌入理论,该方法将分组增强表示施加到目标函数中,对样本数据施加平滑依赖以获得更显著的类内亲和力,维护了原始数据空间中的局部几何结构。最后,该方法引入2,1范数正则化项来降低噪声和离群值对聚类结果的干扰,提高了算法的鲁棒性。在人脸图像、新闻、场景图像等六个具有挑战的数据集上进行的广泛的实验结果表明,该方法表现出了高质量的性能。针对现有的子空间框架分开学习自表示矩阵以及共识矩阵,忽略了自表示数据以及共识数据之间存在的紧密联系的问题,本文提出了基于共识表示和正交多样化的自加权多视图子空间聚类算法。考虑到不同视图的特征数据表征了特定和部分独立的信息,可能会对最终的聚类结果造成差异化的贡献,该方法首先通过一种新的技巧为每个视图自动分配相应的权重。然后,该方法将共识表示和子空间学习集成到一个统一的框架中,以从不同视图中表征一致性。在此基础上,本文添加了正交多样化项,并采用乘子交替方向法对算法进行优化。在上述六个数据集上进行了实验仿真,实验结果显示该方法是比同类算法更优秀的算法。
其他文献
随着集成电路规模的增长和现场可编程逻辑门阵列(Field Programmable Gate Array,FPGA)集成度的提高,FPGA电子设计自动化(Electronic Design Automation,EDA)工具的处理能力已经跟不上日趋复杂的电路和芯片结构,其编译时长和结果质量都成为了目前主要的性能瓶颈。布局是EDA流程中最为关键、耗时最长的环节之一,其布局结果质量对FPGA电路系统的
学位
步入集成电路时代以来,FPGA正以前所未有之势,驱动着通信领域、数字信号处理领域等现代数字系统高速发展。国内的FPGA研究主要基于学术虚拟FPGA芯片和学术开源EDA软件,但是随着半导体制造工艺的提升,商业FPGA芯片的资源数量飞速增长,各项指标远超学术芯片,这导致FPGA芯片设计和相关理论研究变得愈加困难。因此,提供国际先进商业FPGA芯片模型实例对于探索FPGA体系架构和EDA算法研究具有重要
学位
近些年来,越来越多的证据表明,非编码RNA(nc RNAs)与癌症的发生和诊疗密切相关。全基因模型的研究指出,核心基因的强效应、外围基因的弱效应在生物网络中的累积作用与复杂疾病相关,而大多数具有弱效应的变异发生在非编码区域。癌症作为典型的复杂疾病,其发生既受基因变异和异常表达的影响,又与基因间的相互作用有关。基于网络模型挖掘表征癌症的子图是研究癌症的重要途径,这可以揭示癌症分子机制,并提供潜在的诊
学位
在钢材制造过程中,一方面由于机器质量、人为误操作等因素,导致工业产品表面缺陷问题难以避免,为了保证产品自身的价值,必须及时处理这些缺陷。另一方面,深度学习方法已被证明在图像处理的各个领域都优于传统的机器视觉方法。而钢材生产环境中有限的资源配置与深度学习中庞大的神经网络模型之间却存在着相互制约的关系,导致难以将这些神经网络模型应用在钢材质检流程中。对于深度学习而言,模型的好坏取决于训练数据的规模大小
学位
近年来,随着集成电路设计与制造水平的不断提高,开关电源产品正在向高效率、高集成度、小体积以及高功率密度等方向发展。而传统的采用二极管作为开关电源整流器的方式在低压大电流的应用背景下会产生较高的整流损耗,不利于开关电源效率的提升。因此提出了同步整流(Synchronous Rectification)技术,即采用通态电阻极低的功率MOSFET来代替传统二极管作为整流器件,可大幅降低整流管的管压降,保
学位
近年来,随着计算机行业的高速发展,相关的高性能应用已经成为当今社会生活不可缺少的一部分。围绕这些高性能应用展开的相关研究也已经成为计算机系统结构、算法和编程等领域的热点,而这些高性能应用一般都伴随着大容量、高速度、多类型的数据处理和计算。伴随着后摩尔时代的到来,算力已经成为制约高性能计算发展的重要因素之一,从而使得多核心并行计算逐步成为主流,但不容忽视的是,这些高性能计算虽然带来了算力的提高,但是
学位
随着空间电子技术的发展,未来航天器将采用分布式综合模块化电子系统,这将是占领太空网络战略至高点的关键技术保证。总线网络作为卫星、航天器的“神经中枢”,在信息传输的过程中起着至关重要的作用。海量的数据处理,高速的信息传输,复杂的应用场景,对航天器总线网络的可靠性、实时性、多源融合网络数据流传输的要求越来越严格。传统的卫星以及航天器普遍采用1553B数据总线进行模块间信息的传输,其效率低下、互联繁琐、
学位
黑色素瘤是由黑色素细胞病变形成的肿瘤,该肿瘤的治疗主要通过早期手术切除,但其早期一般无明显疼痛或瘙痒等症状,导致发现非常困难,而黑色素瘤中后期的治疗预后效果极差。随着单细胞测序技术的发展,在细胞水平对基因表达情况的度量得以实现,为癌症等复杂疾病的分子机制研究提供了新的分析角度。本文基于单细胞RNA测序数据识别黑色素瘤的候选生物分子标记物,为黑色素瘤的诊断、治疗和预后等方面提供相关信息。主要工作总结
学位
推荐系统是大数据时代背景下不可或缺的应用之一。在现今的大数据时代,信息过载已成为一种常态现象,而推荐系统能够帮助用户从海量信息中更加快速地找到他们所感兴趣的内容。在常用的推荐系统算法中,往往需要将用户所有的信息(如用户的身份信息,历史交互信息等)都加以利用来生成个性化服务。但在很多实际场景中,是无法获取用户所有的信息,比如说用户是匿名的;此时用户身份信息以及历史交互信息无法获取,传统的推荐算法将无
学位
深度学习因其为非结构化数据提供了强大的自动特征提取和表征能力,从而在计算机视觉、自然语言处理、机器人技术等人工智能领域展现了优异的性能。针对不同的实际应用场景,人工设计出了许多高性能神经网络结构,但手工设计网络结构往往需要丰富的目标领域专业知识与极高的人工成本。为了解决这一问题,自动化设计神经网络结构受到了学术界和工业界的广泛关注。神经网络架构搜索(Neural Architecture Sear
学位