基于图反卷积网络的无监督表示学习方法研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:jly1211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图是一种由结点和边构成的拓扑型数据结构,在金融、生物、社交等领域的复杂系统建模中扮演着重要的角色。常见的图网络数据有知识图谱、蛋白质交互网络和社交网络等,通过对图网络数据的分析可以完成一些重要的任务。例如,社交网络中的用户推荐和社区发现任务、蛋白质交互网络中某个特定蛋白质的功能识别任务、协作网络中某个员工的角色预测任务。图表示学习是一种获取结点或子图低维度嵌入向量的有效方法。与传统的结点嵌入学习方式相比,图表示学习能够减少对图统计数据、核函数和手工选择特征的依赖,更加关注图网络数据在原始空间和特征空间的相似性研究。根据学习结点嵌入的过程中是否使用标签信息,图表示学习方法可以分为有监督学习、半监督学习以及无监督学习。无监督的学习方式不依赖数据的标签信息,整个学习过程与需要完成的任务类型无关,通过这种方式学习到的结点嵌入在不同任务上的泛化性能更好。本文提出了一种不依赖具体任务的无监督图表示学习模型:图反卷积网络,显著提升了结点分类任务与社区发现任务的准确率。本文的主要工作总结如下:(1)本文提出了一种创新性的无监督图表示学习模型:图反卷积网络,以及相应的无监督学习算法。图反卷积网络模型学习结点嵌入的方式,与图卷积网络从根本上不同。图卷积网络以一种自下而上的学习方式来获得结点嵌入,模型通过有监督的方式学习到卷积核后,使用结点特征矩阵与卷积核的卷积操作获得结点嵌入。而图反卷积网络将结点嵌入与卷积核均看作模型参数,通过结点嵌入与卷积核的反卷积操作,重构出结点特征矩阵。图反卷积网络以一种自上而下的学习方式来获得结点嵌入,模型的优化目标是最小化重构特征矩阵与输入特征矩阵之间的差异,并采用了交替优化算法来同时学习结点嵌入与卷积核参数。(2)本文通过大量的工程实验,验证了图反卷积网络能够显著提高图网络的结点分类和社区发现的准确度。在实验中,首先通过图反卷积网络模型学习到图网络数据中结点的低维嵌入向量,进一步将结点嵌入向量作为支持向量机分类器和K-means聚类器的输入,来完成结点分类和社区发现任务。在与其他经典图表示学习模型的实验对比中,图反卷积网络模型表现出了显著的性能提升。
其他文献
随着智能手机等设备的普及,各种数字图片更加频繁地出现在人们的日常生活当中。如何让计算机通过图像来认识世界是许多学者一直研究的任务,其中一个重要子任务是图像显著性检测。图像显著性检测是许多图像处理任务的重要步骤之一,目前已经提出很多图像显著性检测方法。RGBD图像相较于彩色图像拥有额外的深度图,具有更全面的3D空间结构信息。本文致力于研究基于深度学习的RGBD图像显著性检测方法,包括基于边缘感知和跨
学位
文本情绪原因识别任务的目标是从文本中识别某种情绪表达背后的原因,已逐渐成为自然语言处理领域中的热点研究方向之一。近年来,随着深度学习技术的发展,该领域的相关研究取得了不错的进展。尽管如此,仍然存在着诸多挑战:未能充分利用文本子句间的相对位置距离特征,难以精确定位目标情绪子句的位置所在;未能充分挖掘文本中字符级、词语级等多粒度的文本语义特征;不能很好解决情绪多样化和数据不平衡带来的模型性能受限的问题
学位
公共交通在很大程度上能提高道路利用率,降低程度拥堵。城市轨道交通在公共交通中占据了相当重要的一环,相对于普通公交而言,轨道交通拥有独立路权,不会受到高峰时期道路拥堵的影响,同时城市轨道交通的运力又远大于同样拥有独立路权的快速公交。城市轨道交通成为了越来越多大城市缓解道路拥堵问题,改善路面交通的首要手段,是城市交通的核心之一。地铁客流关系到地铁系统的运营调度,是地铁数据中重要一环。分析不同条件下地铁
学位
跨领域文本情感分类旨在利用迁移学习算法实现领域间的知识迁移以解决目标领域标注样本匮乏的问题,是自然语言处理领域中重要研究分支之一。目前研究者们提出了一系列基于深度学习的方法来学习领域间的共性特征并取得了一定的成果。尽管如此,仍然存在以下挑战:现有方法捕捉句子中局部关系的能力不足,导致情感分类存在偏差;以往方法在提取文本特征时难以有效利用文本的上下文依赖关系与整体信息;现有模型存在分类特征空间受限的
学位
发型是人脸外貌的重要特征,发型识别在许多领域都具有价值,如美容美发行业的发型推荐,游戏角色自动生成中的发型选择等。基于头像的发型识别是指给定一张包含具有头发,人脸信息的头像图片,通过对头像的分析,识别出头发的造型。本文针对网龙网络游戏公司提出的发型识别的任务需求,通过计算机视觉技术对发型识别进行了研究,主要工作如下:(1)通过引入注意力机制和多金字塔池化模块,本文提出了基于PSPNet改进的头发语
学位
随着知识数量的指数增长,知识图谱成为了组织知识的有效工具,其已被广泛应用于各行各业。近年来,为了应对知识缺失问题,以机器学习为基础的知识表示学习方法备受关注,该方法将知识表示为向量,使计算机能够理解和使用。目前,平移模型和基于神经网络的模型是知识表示的两大研究热点。平移模型虽然可以有效地捕获知识的结构信息,但该类模型设计简单,学习能力常常受到限制。基于神经网络的模型虽然表现出强大的学习能力,但其忽
学位
异构信息网络是现代信息网络中的普适性存在,且随着互联网技术的日益发展,其智能分析结果广泛应用在个性化推荐等各种领域中。但作为一种复杂的非线性结构,异构信息网络的高维、异构等特性给其直接挖掘带来了困难。网络表示学习通过映射函数的学习将信息网络中的节点表示成低维、稠密的向量形式,可为后续节点聚类等智能分析任务提供有效的特征表示机制,目前已成为信息网络挖掘中重要的研究基础。目前,网络表示学习方法在同构信
学位
随着现代医学成像技术的发展,不同类型的成像设备为医学诊断提供了不同模态图像,从不同层面反映器官或者组织的功能信息或者结构信息。临床上通常需要综合同一个病人多个模态图像的信息以作出更加准确的诊断。因此,不同模态医学图像的配准和融合是医学图像智能处理领域中的研究热点。临床上使用的医学图像模态种类繁多且成像差异显著,给医学图像的配准和融合带来了极大的挑战。一方面,不同模态间成像差异的表征各不相同,现有医
学位
聚类作为机器学习领域中一项基本而重要的任务,得到了极大的发展。具体来说,该任务以数据标签未知为前提对数据进行分组,应用范围广泛。在过去数十年间,单模聚类的方式占据了主导地位,这种方式仅考虑到样本在特征上的分布情况。然而,最近的研究表明,双模聚类的性能表现通常优于单模聚类。具体地,双模聚类基于样本和特征之间的二元性,即样本可以根据其在特征上的分布进行分组,同时特征也可以根据其在样本上的分布进行分组。
学位
血涂片图像中白细胞的计数和识别对诊断包括白血病在内的某些血液疾病起着至关重要的作用。血液疾病的诊断通常由医生通过显微镜对血液涂片图像进行目视检查,但这种人工的方式既费时又费力,诊断结果依赖医生的经验,较为主观,且容易受到视觉疲劳等因素的影响导致检查精度下降。因此,有必要发展白细胞自动分析技术,而白细胞自动分割是进行白细胞计数和识别等自动分析的基础。本文以血涂片图像中白细胞分割为主题,提出了三种基于
学位