基于重标识随机游走框架的节点角色表示学习

来源 :吉林大学 | 被引量 : 0次 | 上传用户:lvsby2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
事物之间总是有千丝万缕的联系,这些联系就构成了不同的网络。网络在现实世界中极其普遍地存在,因此研究网络的性质将提升人们对于网络演化的理解,进而帮助人们更好地建模现实世界,从而提升各种现实任务的性能。事物在现实中有不同的属性,导致其在与其他事物的交互中有不同的功能,于是在网络中有不同的角色。在同一网络或不同网络中执行不同功能的节点往往具有不同的角色,而在同一网络或不同网络中执行相似功能的节点往往具有相似的角色,这些角色往往可以从网络的结构中反映出来。从网络结构中学习节点的角色表示即为结构角色表示学习,也即本文关注的主要问题。学习节点角色的表示有助于我们理解网络并将我们在某些网络上得到的知识用于其他网络,以促进我们对网络信息的理解和利用。然而,大多数现有的结构角色表示学习方法或者时空复杂度很高,以致难以应用于大规模网络,或者依赖于启发式特征工程,难以泛化,得到的表示鲁棒性差。因此本文提出RiWalk,这是一个用于学习节点结构表示的灵活框架。它将结构嵌入问题分解为重标识过程和网络嵌入过程。通过重标识,可以在保持结构依赖性的同时构建以中心节点为根的图核,使得结构相似的节点具有相似的上下文节点,从而可以更好地集成网络嵌入方法。这一解偶过程保持了框架的简洁性和灵活性,同时也能更充分地利用已有的网络嵌入方法在节点社区表示方面的成果,而且网络嵌入的高效可扩展的特性也能提高本文所提出框架的效率。为了证明RiWalk的有效性,本文提出了两种不同的重标识方法,分别称为RiWalk-SP和RiWalk-WL,它们分别与两种经典的图核方法——最短路径图核和Weisfeiler-Lehman图核——相关联。为了保持算法的简洁和并行性,本文采用了基于随机游走的网络嵌入方法来在重标识过程构建的重标识子图上学习结构角色表示。为了避免子图遍历以进一步提升重标识方法的效率,本文也同时给出了其中一个重标识方法的基于随机游走的变体版本RiWalk-RWSP,在该变体中,我们不再遍历子图,而是由随机游走序列中获取中心节点周围的拓扑结构信息。本文通过在一个高速公路网络上的案例分析说明了典型的网络表示学习与结构表示学习的本质区别,两者对于类标签在网络上分布的平滑性有不同的假设。本文通过同网络内的节点分类任务表明,RiWalk在实现与其他基准算法相当的准确率的同时,效率可高一个数量级以上。且尽管RiWalk-SP与其中一个基准算法基于同样的假设,在使用RiWalk框架后,其表现超过了对应的基准算法,这说明了RiWalk框架的优越性。此外,本文还执行了跨网络的节点角色分类任务,结果表明结构嵌入可在不同网络上迁移,显示出结构嵌入在迁移学习中的潜力。此外,在不同大小、不同密度的随机网络和现实世界网络上的实验说明RiWalk具有很好的可扩展性,使其能够利用于现实世界的大型网络。
其他文献
创新既是一个民族不断进步的灵魂,也是企业向前发展的源源动力。企业集团作为一种重要的组织形式已经随处可见,近年来,国家政策和经济形势的推动下,我国已经建成一大批具有高质量、强竞争力的大型企业集团。在此背景下,本文探索了企业集团对企业专利创新的影响及其影响路径,得出了企业集团可以促进成员企业的专利创新的结论。本文的研究结论一方面拓宽了企业创新产出的研究视角,另一方面为企业提高创新产出水平提供了新的思路
云计算产业在全球范围飞速发展,吸引越来越多的企业及个人用户将其业务转移到云市场。在云计算中,云用户的需求有不同特性,部分用户对资源需求迫切,也存在用户对价格较为敏感
关联交易是一种常见的交易形式,在优化资源配置、节约交易成本和简化交易流程等方面,关联交易能够发挥其固有的优势,以便于更好地促进交易继续进行。但随着经济的飞速发展,关联交易的缺陷逐渐超越了其自身的优势,并且在关联交易中,双方主体之间地位上的不平等,就更加剧了关联交易在利益分配上的不均衡性。关联交易一开始的目的是通过减少公司经营中不必要的环节,减少成本,分散风险,获得利润最大化。而不公平的关联交易,会
网络作为一种很常见的数据形式遍布于我们的日常生活,包括社交网络、交通网络以及生物网络等。这些网络中的节点与连边都蕴含着丰富的语义信息,通过对它们的分析,我们能够洞
随着IPv6网络技术的快速发展,网络应用愈发广泛,学生的学习和娱乐离不开IPv6校园网的支持,也使得校园网出口数据流量越来越大。为了了解校园网内学生的上网习惯是否健康,并保
黄金具有良好的避险能力,因此很多投资者投资并持有黄金资产,来降低投资风险实现资产保值。作为一类金融资产,黄金当然会受到各种因素的影响而产生价格波动,并且波动会在市场间传递。因此,把握中国黄金市场与其它黄金市场之间的关系,分析其溢出效应特征,无论从投资者风险管理的角度来看,还是对监管者维护市场稳定而言都是非常必要的。本文对上海与伦敦、纽约、东京三个黄金市场之间的多尺度溢出效应和套期保值问题进行探讨。
2017年中央一号文件指出将会大力支持具有相关基础的田园综合体建设,未来农村工作的重点是提升农业生产效率,提升农民收入,提升农产品附加值。以生态农业理念为发展先行理念,结合生态可持续发展理念,发展融合当地特有生态资源、旅游观光资源、农业观光资源等多要素一体的田园综合体。随着我国国民经济发展的不断深入,农村发展问题、农民增收问题、农业供给侧结构问题不断被重视,传统的休闲农业发展模式与我国国民经济发展
自1978年改革开放以来,经济迅猛发展,在世界范围内取得了瞩目的成就。城镇化进程也随着经济的发展在逐步推进,城镇数量不断增多,城镇功能更加完善,城镇人口呈现出暴增的趋势,城乡收入差距扩大问题也随之引起全社会广泛关注。中国城乡之间劳动力的自由流动能够促进资源的优化配置,收敛城乡之间收入差距,但是在中国城乡割据的二元经济体制下,劳动力的自由流动受到限制,导致农村经济的发展长期滞后于城镇经济的发展,城乡
近年来,随着互联网技术、信息通信技术不断取得突破,互联网与金融快速融合,互联网金融在我国得到快速发展。随着国家鼓励互联网金融政策的推进,我国的P2P网贷行业迅猛发展。
近年来,具有力致荧光变色(MFC)和摩擦发光(ML)活性的有机发光材料作为可对外界刺激产生响应的智能材料日益受到人们的广泛关注,它们已逐渐应用于压力探测、生物传感器、信息记录