基于自监督的属性网络表征学习研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:mimidong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
属性网络广泛分布于真实世界中,包括引用网络、社交网络和交通网络等。属性网络中蕴藏着丰富的信息,包括节点之间的复杂关系、节点携带的属性和属性网络全局的性质。由于属性网络的复杂性和多样性,直接分析属性网络不仅需要丰富的专家知识,也需要大量的尝试。属性网络表征旨在将属性网络中的节点映射到低维表征,同时保留节点自身丰富的语义信息以及节点之间的近似性。由于真实世界中的属性网络通常包含很多节点,人工标注这些节点代价很大。因此,如何在不依赖人工标注信息的情况下学习节点表征,是近年来的热门研究方向。本文聚焦于基于自监督的属性网络表征学习研究,旨在从数据本身中自动提取监督信号,训练模型得到高质量的节点表征。属性网络中的节点具有两种不同的信息,分别是拓扑信息和属性信息,其中拓扑信息可以分为低阶结构信息和高阶结构信息。现有方法能很好捕捉低阶结构信息,但不能很好建模节点的高阶结构信息。同时现有方法融合节点拓扑信息和属性信息的策略比较简单,不能很好捕捉这两者之间的关联。本文提出的方法,分别是基于性质预测和基于对比的自监督属性网络表征方法,其研究内容与主要贡献如下:第一,针对现有方法不能很好建模节点高阶结构信息的问题,本文提出了一种基于性质预测的自监督属性网络表征方法。该方法提取节点的正点互信息矩阵作为高阶结构信息,并利用邻接矩阵和节点属性预测节点的高阶结构信息,从而融合节点的属性信息和各种结构近似性,能学得高质量的节点表征。另外,本文使用主成分分析法对正点互信息矩阵降维,大大降低了模型的空间复杂度。第二,针对现有方法不能很好融合节点拓扑信息和属性信息的问题,本文提出了一种基于对比的自监督属性网络表征方法。该算法最大化节点拓扑表示和属性表示之间的互信息,从而建模节点拓扑信息和属性信息之间的关联性,并且融合两者的互补信息。该方法不依赖于增广操作和图卷积网络。另外,本文提出的融合策略能灵活选择不同的拓扑信息作为模型输入。该算法在节点分类和链路预测任务上取得了优秀的表现,证明了本方法融合策略的有效性。
其他文献
目的 调查宫颈癌患者健康促进生活方式的现状,分析其影响因素,探讨与自我管理效能感的相关性,以期为临床宫颈癌患者的健康促进干预提供依据。方法 采用便利抽样法,选取2019年6月—2020年6月南昌大学第一附属医院妇产科收治的宫颈癌患者120例,采用自行设计的一般资料量表、中文版癌症自我管理效能感量表(SUPHH)及健康促进生活方式量表Ⅱ(HPLP-Ⅱ)进行问卷调查,回收有效问卷110份,对结果进行分
期刊
目的:观察首荟通便胶囊治疗功能性便秘的临床疗效。方法:将40例功能性便秘患者随机分成两组,治疗组口服首荟通便胶囊2粒,每日3次;对照组口服枸橼酸莫沙必利片5mg,每日3次,疗程均为2周。结果:治疗后两组患者的临床症状积分均较治疗前明显改善(P<0.05);治疗组总体疗效与对照组比较有统计学意义(P<0.05);两组均未发现明显不良反应。结论:应用首荟通便胶囊治疗功能性便秘总体疗效优于枸橼酸莫沙必利
会议
面向开放域的问答任务要求问答系统通过检索知识文档库,找到问题相关性段落,把问题和段落输入阅读理解模型后预测出问题答案。和限定域问答相比,开放域问答中问题查询内容没有约束,知识主题更加广泛,如何准确检索到和问题匹配的文本段落是预测出正确答案的关键。现有研究方法对语义模糊性问题的澄清能力不足,难以从中提取到关键特征,导致段落检索效果不佳,最终影响答案预测准确率。因此,研究检索模型对开放域问答有着重要意
学位
近年来,自监督学习因其简单且有效在深度学习领域大放异彩。自监督学习只通过无标记数据集,通过构造代理任务生成伪标签来训练深度卷积神经网络,解决了大规模标记数据集难以获取的问题。传统的自监督学习要求深度卷积神经网络使用外部代理任务(即基于图像或视频的任务)来编码高级语义视觉表示。本文提出了卷积神经网络内部的特征变换也可以看作是监督信号来构造自监督任务,称为内部代理任务。并且这种任务可以用于监督学习的增
学位
随着大数据时代的到来,数据成为重要的生产要素,数据规模也越来越大。云存储的出现减轻了用户的数据存储压力。然而,云存储无法保障外包数据的机密性,且云服务提供商本身是不完全可靠的,存储和查询服务质量会受到经济利益等因素的影响。可搜索加密技术通过构建密文检索方案保障了数据存储的安全,区块链则能够确保数据查询的正确执行,增强云服务的可信性,二者结合,能够有效解决云存储的安全性问题。在实际应用中,外包数据需
学位
新冠肺炎疫情影响全球已达两年之久,对社会和人们生活造成了颠覆性的影响,涉及到了整个社会的方方面面。语言作为人们赖以交流思想的主要媒介也难免因此而产生变化。大量新闻媒体一直以来都保持着对疫情的高度关注,也因此产生了大量可供语言研究者分析的新闻语料。这些语料相比社交平台语料而言,语言更加规范且能从多角度描述疫情和社会生活的关系,是很好的分析素材。本研究从认知语言学的视角出发,试图应用框架语义学和构式语
学位
深度学习在计算机视觉领域的表现十分亮眼,基于深度学习的方法能够处理很多图像相关的问题,比如图像生成、图像修复等。生成式对抗网络作为深度学习中的一种重要方法,能够生成高质量的图像,用于扩充数据集、图像分类等。虽然生成式对抗网络的表现十分优秀,但是其存在着许多问题,如训练不稳定、模式崩溃等,需要进一步的改进优化。首先,本文提出了一种基于生成式对抗网络的两阶段图像生成方法,提升生成式对抗网络的图像生成能
学位
文章以宁波舟山港为例,结合专家访谈结果,梳理出港口发展的影响因素。通过DEMATEL方法分析各影响因素相互间的作用程度,并以此为依据确定各影响因素间的因果关系和每个因素在系统中的重要程度;采用ISM方法,对各影响因素进行层级划分,厘清各要素间的逻辑结构关系,再运用MICMAC方法将所有影响因素进行归类。通过研究发现:资源整合能力、安全运输保障、港腹互动、专业人才、港内外资聚集度,处于解释结构模型的
期刊
联邦学习是一种分布式机器学习框架,它允许具有计算能力的节点在不移动本地数据的情况下进行全局模型(也称之为联邦模型)的联合训练,其能有效保护数据隐私并减少计算负担,同时能取得与集中式训练的模型相当的性能。然而,联邦学习能取得上述效果多基于独立同分布假设,即各个节点上存储的数据是独立同分布的(Independent and Identically Distributed,IID),并且最近的研究发现,
学位
<正>近年来,教堂在认真贯彻落实党和国家宗教方针政策,积极发扬爱国爱教精神,狠抓和谐寺观教堂创建工作等方面都取得了积极的成效。重庆市云阳县天主教圣安多尼堂原名云阳县天主堂,始建于清光绪三年(1877),距今已有140年历史。在三峡库区移民迁建过程中,圣安多尼堂顾全大局,克服重重困
期刊