复杂网络结构的表示学习研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lovelywd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络结构在现实生活中大量存在,如社交网络,引用网络等。随着数字化的推进,有效利用网络结构信息成为数据挖掘中重要的一环。网络表示则是解决这一问题的有力工具,通过将网络中的节点学习为低维向量表示从而有益于下游任务,是目前数据挖掘中的研究热点。网络数据中最简单的为同质网络数据,也就是节点属于同一类别且只有简单结构信息,同时边只有一种类型的网络结构。然而,现实数据中的网络数据复杂多变,通常以复杂网络结构的形式存在,比如节点属于多个含有多种类型的信息,节点之间的边具有多种类型等。知识图谱和属性网络都属于复杂网络结构,其中知识图谱网络表示的建模通常由对事实三元组的链路预测任务间接产生,它含有多种类型的边并且节点的类型多种多样;而属性网络表示的建模需要在同质网络的基础上融合属性信息,也就是节点同时具有结构信息和属性信息两种异质信息。本文分别研究了复杂网络结构——知识图谱网络和属性网络的表示学习,探究了当前工作存在的问题,基于深度信息交互的基本思想为以上网络的建模提出了新的解决方法,主要工作如下:·探究了知识图谱嵌入中存在的先验知识利用不充分问题并提出解决方案;知识图谱由三元组组成,其中的关系对于实体的预测和表示有着指导性的作用,而以往的工作都没有显示地建模这一点。我们提出一种基于关系约束门的方法,模型约束正确的实体尽量接近学习到的泛化表示同时约束错误实体远离该表示。该方法显式地利用了关系的约束能力,扩展到多个模型上并在多个数据集的链路预测任务上取得了提升。·探究了知识图谱嵌入中的噪音过滤问题并提出解决方案;知识图谱的链路预测过程本身是个推理过程,我们通过模拟人类的预测推理过程提出了一种基于多步迭代门机制的知识图谱表示学习算法。该方法利用门机制控制关系和实体的交互,过滤无用或噪音信息,并通过多步迭代的机制加强过滤效果,得到较好的预测结果。该方法在多个数据集上都取得了链路预测的最优效果,通过消融实验验证了模型中各个模块的有效性。·探究了属性网络中的异常点问题并提出解决方案;属性网络中存在大量异常点,一个节点可能与和它结构相近的邻居节点或属性相似的邻居节点并不属于同一类别,然而目前很多模型都是基于这样的相似性假设;此外,结构和属性信息存在分布不一致现象,也就是二者对节点的描述不统一,亟待深度挖掘互补信息弥补原信息不足。本文提出了一种基于邻居增强的深度属性网络表示学习模型,模型通过截断邻域采样和相似度限制高效地挖掘有效邻居信息,提出了反向注意力机制多元化地融合邻居信息,通过深度自编码器建模并输出高质量表示。模型在多个数据集上的节点分类,节点聚类和可视化任务上都有优秀的表现。模块分析和参数敏感分析进一步验证了模型的有效性。
其他文献
现实世界中的许多场景都可以抽象成网络这种非欧几里得空间的数据。这些大规模的异质、动态网络统称为复杂网络。在传统的复杂网络分析研究中,节点的特征需要手动提取,很大程度上依赖于网络的类型、专家的经验和任务的类型。与之不同,网络表示学习能够自动学习一个映射函数来得到网络的有效表示,尽可能保留网络中丰富的信息。当前的网络表示学习研究存在诸多挑战:1)方法主要面向同质网络(即只有一种类型的节点和边)设计的,
70年前,为了保卫和平,反抗侵略,无数中华儿女雄赳赳、气昂昂跨过鸭绿江,他们高举正义旗帜,与朝鲜人民一道并肩战斗、舍生忘死,书写了气壮山河的英雄史诗,历经两年零9个月最终
门静脉高压症(Portal hypertension,PHT)是世界范围内的一种常见病、多发病,严重影响病人的生存质量。PHT引起的消化道出血、腹水、肝性脑病等仍然是导致患者死亡的主要原因
今年是中国人民志愿军抗美援朝出国作战70周年,习近平总书记就发扬抗美援朝精神强调,我们要铭记抗美援朝战争的艰辛历程和伟大胜利,弘扬伟大抗美援朝精神,雄赳赳、气昂昂,向
随着我国经济的发展,国家的科研水平在不断提高,在许多领域都有巨大的贡献。与此同时,中国与国外技术交流日益频繁,国外学者也需要了解中国在科研领域的进展,而英语便是这一过程中必不可少的交流工具。因为国际期刊的通用语言是英语,国内学者可以用英语表达自己取得的成果,与其他学者进行交流。在纽马克交际翻译理论的指导下,笔者分析了委托材料的文本特点,确定了委托材料为信息型文本,适合采用交际翻译的模式指导翻译。纽
党的十八大以来,作为全面深化改革的一项重要内容,国资国企改革的力度和深度都不断加大。在内外部双重的发展压力下,国有企业不能再一味走以往规模化、粗放式的发展老路,而是
在信息时代中,网络是对数据进行表示和分析的常用结构,例如论文引用网络、微博用户网络、生物网络。在网络中用节点表示实体,用边表示实体之间的关系。经过多年的研究,学者们发现大部分网络都具有社区结构,即网络可以被划分为数量不等、大小不一的节点的集合。在同一个社区中的节点关系比较密切,属性比较相似;在不同社区间的节点关系比较稀疏,属性差异较大。随着数据的复杂度增加,网络也日渐复杂,特别地,网络中的节点可能
为深入学习领会习近平总书记在纪念中国人民志愿军抗美援朝出国作战70周年大会上的重要讲话精神,2020年10月26日,中共中央党史和文献研究院召开"弘扬伟大抗美援朝精神,做好新
本文旨在探讨如何有效利用复杂网络中的背景信息进行鲁棒性的社团发现。这里的背景信息主要是指:网络中结点的属性和半监督信息。针对上述两类信息,本文分别设计了两类社团发
对于成人文学而言,苦难并非新鲜话题。随着文学观念的转变,儿童文学界出现了大批描写苦难的作品。这些作品关注儿童成长过程中遇到的挫折、磨难、创伤等阴暗面,值得深入讨论和研究。儿童的成长过程中既有欢乐也有苦难,所以儿童文学需要书写苦难,需要关怀孩子们的真实生活,洞察他们的内心世界,引导他们走出困境,培养正确的苦难意识。在翻译这类作品时,为了让更多的英语读者了解国内儿童文学作品对苦难主题的探究,译者需要关