基于深度学习的子空间聚类研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:ynhappyma
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通信技术与互联网的普及,人们能获取到的信息是之前难以想象的,数据已经变成生产要素在各行各业发挥着重要的作用。由于大部分数据都是未标注的,创建标签又需要花费巨大的人力。聚类方法通过数据内在属性的关联,将其分为若干个类别(簇),能对数据进行有效的分析,以提取有价值信息指导生产。受益于深度神经网络的提出与发展,将传统聚类结合深度学习以利用其特征提取能力被越来越多的研究者所关注。基于自动编码器的深度子空间聚类方法就是其中的佼佼者,这归功于深度神经网络提取的强大表示能力,同时优先考虑了类别可分离性。但是,自编码器的自我重建损失会忽略丰富的有用关系信息,并可能导致不加区别的表示,从而不可避免地使聚类性能恶化。在不提供语义标签的情况下学习高级相似性也是一个挑战。面临的另一个未解决的问题是由编码器和解码器之间的自表达层引起的存储器成本高。为了解决这些问题,我们提出了伪监督深度子空间聚类,我们使用成对相似度来加权重建损失以捕获局部结构信息,而相似度则通过自表达层来学习。伪图和伪标签使我们能够利用训练中获得的不确定知识,还可以用来监督相似性学习。通过使用联合学习和迭代训练有助于获得总体最佳解决方案。本文通过大量的实验,在多个数据集上比较了相关的方法,提出方法在聚类结果的优异表现证明了其优越性。自表达层引起的高存储成本问题,导致提出的模型无法直接应用大规模数据集。为了解决大规模和样本外问题,我们进一步将模型与k-最近邻居算法相结合,通过对小批次数据聚类,用k-最近邻居算法将小批次数据的聚类结果拓展到整个数据集。成功将提出的模型应用于大规模数据集,并通过实验验证了提出方法的有效性。
其他文献
随着人工智能技术的不断进步,现有机器模型已经基本达到了感知智能,正朝着认知智能前进。自然语言处理是智能认知的基础,是学界和工业界的研究热点。为了满足社会对各种语言的需求以及世界各国日益频繁交流更加的便捷,价格低廉的机器翻译研究正在逐渐兴盛。随着深度学习技术的持续提高,机器翻译也逐渐融合了这些方法和策略,并且在多个任务中斩获不错的成绩。但是还存在一些不足的地方。首先,大多数的翻译模型都基于注意力机制
飞机在结冰气象条件下飞行时,机翼、尾翼、发动机、传感器等核心部件易发生结冰现象,其中机翼结冰不仅会影响飞机的气动性能,严重时还会导致飞行事故的发生。因此,开展飞机结冰原理研究、预测翼型结冰及其气动特性变化具有重要意义。当前飞机结冰预测方法主要包含飞行试验、风洞试验以及数值计算等方法,这些方法往往存在预测周期长、所耗资源大等问题,无法实现快速、高效地预测。对此,本文利用深度学习开展翼型结冰相关研究,
实体关系抽取是自然语言处理领域中处理非结构化文本的重要方法,能够从非结构化文本中提取出有效的实体对和关系,形成(头实体,关系,尾实体)的关系三元组结构,进一步生成实体关系网络,是搭建知识图谱及后续拓展研究的技术基础。生物医学领域存在大量的非结构化文本,同时业界对这些文本的分析处理也有浓厚的兴趣,因此本文选择该领域作为应用场景。随着深度学习技术的发展,基于深度学习的实体关系抽取方法较传统的特征提取方
随着经济全球化的进程,金融活动日益活跃,洗钱犯罪行为也日益猖獗。而银行作为金融活动的主要机构,是洗钱的主要渠道,因此建立一套高效准确的风险防控系统可以给银行在日常的交易活动中带来很多便利。银行以往的反洗钱系统都是基于专家经验知识,在面对手段多样化,团伙作案、高效化的洗钱犯罪行为时,显得有些捉襟见肘。基于这种情况,本文在银行提供的丰富的日常交易数据的基础上,建立了一个高效准确的反洗钱监测服务系统。本
随着无人系统规模不断增长,现行有人/无人集中式控制技术瓶颈越发明显,亟需分布式、去中心化的自主协同,以达成更为灵活的自主可变的协同规划系统。然而目前针对自主可变集群规划系统的研究,在技术架构、实现方案上均鲜有报道。因此本文提出基于团队导向计划的自主可变集群规划系统,通过对有人/无人集群协同现状的调研,分析自主可变集群规划的需求,在有人/无人车集群协同探测背景下,设计并实现了基于团队导向计划的自主可
国家航天航空事业蓬勃发展和进步与空气动力学的研究息息相关,如何有效的进行气动建模一直是该领域专家们研究的重点问题,对于传统的基于物理模型的方法来说,由于存在一些复杂且难以求解的偏微分方程导致其计算效率无法满足实际需求。而且需要耗费很多资源。很难满足实际需求。因此有人开展了基于数据驱动的无模型方法研究,但同样存在着生成数据精度不高的问题。基于生成式对抗网络(GAN)模型在诸多领域中的良好表现,因此,
在现实生活中,存在着丰富多彩的复杂系统,例如航空运输系统,海上运输系统等。为了更好地研究种种复杂系统的特性,我们人为地将复杂系统抽象成便于理解记忆的网络结构,这就是复杂网络。在复杂网络的网络结构中,通常会存在一些对维持网络结构和功能的完整性都有着至关作用的节点。一旦这些重要节点受到攻击,网络将会遭到毁灭性的破坏。基于此,本文的工作将围绕着两点展开。一是如何对网络中的重要节点进行挖掘,二是如何对网络
随着数据时代的到来,互联网上产生了海量的文本信息。由于大量非结构化的文本因其结构松散,内容冗杂,无法直接提取关键内容,给数据管理以及分析和挖掘带来了挑战,因此,信息抽取作为从大规模海量文本中抽取结构化知识的技术受到广泛的关注。作为信息抽取的关键子任务,实体识别和关系抽取是知识图谱,智能客服等自然领域上游任务的基础工作,也是帮助法律、金融、医疗等垂直领域实现文本自动化的关键技术,其任务是从输入文本中
深度脉冲神经网络(Deep Spiking Neural Network,Deep SNN)充分结合被称为“新一代神经网络”的脉冲神经网络(SNN)自带的低功耗、生物可解释性、时序任务可处理性等一系列优点以及深度学习(Deep learning)具备的强大的层次特征表征能力,使得SNN已经在图像处理、语音识别等方面的研究更上了一个台阶。已成功应用到传统人工神经网络(ANN)的多尺度理论(Multi
在二维的计算机视觉,深度学习在许多领域都有了突破性的进展,且在许多方面已经优于传统的计算机视觉方法。点云配准是二维计算机视觉中图像匹配问题的三维推广,目前点云配准主要有两类算法,分别是基于全局分布状态直接求解的变换估计算法和基于局部特征提取的特征匹配算法,前者直接根据全局的分布状态估计点云对之间的变换参数,后者则基于几个步骤:关键点检测、特征描述提取、特征匹配与变换估计。本文将深度学习方法引入到三