【摘 要】
:
网络描述了节点和节点之间的关系,可用来定义复杂的数据关系,适用于建立大数据环境下的数据模型,例如社交网络、引文网络、词网络、知识图谱、化学物质网络和蛋白质网络等。网络表示学习的目标是从网络中提取出具有表征力的特征,以供后续的知识发现和知识挖掘任务使用。近年来,随着大数据的普及和深度学习技术的进步,网络表示学习的理论和方法取得了突破性的发展。然而,在网络表示学习的各个环节中,现有研究在信息的利用能力
论文部分内容阅读
网络描述了节点和节点之间的关系,可用来定义复杂的数据关系,适用于建立大数据环境下的数据模型,例如社交网络、引文网络、词网络、知识图谱、化学物质网络和蛋白质网络等。网络表示学习的目标是从网络中提取出具有表征力的特征,以供后续的知识发现和知识挖掘任务使用。近年来,随着大数据的普及和深度学习技术的进步,网络表示学习的理论和方法取得了突破性的发展。然而,在网络表示学习的各个环节中,现有研究在信息的利用能力方面还存在一些不足。其一,为了更好地发现网络中的信息,研究者们常使用基于随机游走的采样策略来拓展结构性特征,但随机游走的策略往往是基于经验的,采样结果所包含的信息量没有得到定义,导致随机性过强。其二,有属性网络可以提供更为丰富的属性信息,但目前的无监督属性网络学习方法,只能应用目标节点的属性,却忽视了邻居节点的属性,造成了信息损失。其三,在属性网络中,对不同的属性和复合属性进行表示是常见的需求,现有方法一般对每一种属性进行单独表示,难以利用不同属性之间的关系,属性关系信息的利用程度不高。其四,在半监督学习的设定下,图神经网络可以有效地利用局部信息生成良好的节点特征表示,但由于过平滑现象的存在,却难以使用网络中的全局信息。本文针对以上网络表示学习中的问题展开研究,增强各环节中利用信息的能力,主要工作包括:1.针对随机游走的策略主要基于经验设定的这一问题,本文设计加权信息熵指标来衡量随机游走采样结果的信息量,并发现信息量越高的采样结果,在统计上会显著提高后续分类和链接预测任务的效果。在此发现之上,本文提出了基于最大化加权信息熵的采样方法,实验表明,本文的采样方法能有效提高后续任务的精度。2.针对有属性网络的无监督表示学习方法不能利用上下文属性这一问题,本文设计了两种目标函数,一种用来保留上下文节点的结构信息,另一种用来保留上下文节点的属性信息,从而学习出可以利用上下文属性、更具有信息量的节点表示。实验表明,本文的方法比基准方法有显著提升,特别是在数据稀疏时表现尤为优良。3.针对在属性网络中对属性进行表示时,难以利用不同属性间关系的问题,本文以属性网络中的引文属性网络为具体研究对象,提出一种基于循环神经网络的编码——解码的表示模型,该模型可以将标题、作者、期刊等不同的属性映射到同一个向量空间中去,再最大化被引论文中属性的概率,从而可以利用不同属性之间的引用关系。得益于统一的表示构架,该方法还可以支持一些有趣的应用,例如审稿人推荐、发表期刊推荐等。并且,由于利用了不同属性之间的引用关系,本文在论文相似度比较中也显著超过基准方法。4.针对图神经网络学习算法难以利用全局特征的问题,在半监督网络表示学习的框架下,本研究提出了可以利用全局特征的图神经网络学习模型,该模型首先使用无监督的随机游走方法从网络中学习到节点的全局结构特征和全局属性特征,再通过一个全局图神经网络算法利用这些信息,从而生成可利用全局信息的节点特征表示。本研究在简单网络表示和属性网络表示两种设定下进行了研究,实验表明,在两种设定下,本文提出的方法均可以显著超过基准方法。
其他文献
活动星系核(active galactic nucleus;AGN)是天体物理领域中重要的研究对象之一,其涉及黑洞吸积、物质喷射、相对论性高能粒子的加速与辐射等多个极端物理过程。多波段的光变是活动星系核最独特的观测特征之一。基于光变分析,理论上能够在巡天中甄别出任何类型的活动星系核。此外,光变分析也是剖析活动星系核物理结构和物理过程最为有效的手段之一。本文基于光变分析,对两类特殊的活动星系核(低光
稀土掺杂的钙钛矿结构锰氧化物由于其自旋、电荷、轨道和晶格自由度之间复杂的相互作用,呈现出丰富的物理现象和复杂的相结构。纳米结构的钙钛矿锰氧化物因具有较大的比表面积,表现出一些不同于块材的新奇物理特性。这不仅为理论研究提供了丰富的素材,也为技术应用提供了可行性。过去的研究主要集中在稀土离子掺杂引起的晶格畸变,导致锰氧化物磁性能的变化,很少涉及到稀土离子的磁矩对磁性能的影响。同时,不同的稀土掺杂元素以
度和与子图结构的研究最早可追溯到1952年,由Dirac在研究著名的Hamil-tonian 问题时提出的.它研究的是在度和比较大的结构里某种子结构的存在性问题.度和与子图结构的研究涉及图论的众多领域诸如Hamiltonian图理论,染色理论,极值图论等.Hamiltonian图理论是推动这一领域迅速发展的重要动力之一.例如,在研究Hamiltonian问题的过程中,不断涌现的新方法和新问题,不但
山东省是人口大省,也是儿童青少年近视发生率较高的省份,防控压力大。自2009年以来,全省由政府牵头,积极贯彻预防为主的健康策略,以"治未病"理念为指导,坚持"预防为主、关口前移",完善体系、综合施策、精准发力,将初级眼保健纳入疾控预防体系,医防协同,防治结合,系统深入开展儿童青少年近视防控工作。努力打造以政府主导为抓手,
由于其相对论性喷流指向地球,耀变体(blazar)是活动星系核中性质最为极端的一个特殊子类。与此同时,耀变体也是宇宙中最为明亮的电磁辐射源之一,被广泛地认为是高能宇宙线和高能中微子的起源天体之一。随着越来越多的可以提供高质量观测数据的空间和地面望远镜的建成,我们对喷流内相对论性粒子的辐射机制有了进一步的认识。在这篇毕业论文中,我们以观测现象为基础建立了耀变体喷流的辐射模型,研究了多波段的辐射性质,
本文的工作主要围绕对法布里-珀罗(FP)微腔的研究展开,基于FP微腔的纵向调制,通过完善其加工工艺大大提高了 FP微腔精细度,并将其应用到全固态激光技术和非线性光学、量子光学领域,实现了激光器频率锁定和腔相位匹配。对于光场横向传输的调制由混合线性-非线性PT对称的光学介质实现,都具有集成、高效的优点。本论文的主要研究内容包括:一、利用高精细度FP微腔自注入锁定半导体激光器实现了激光稳频。自主研发了
AlGaN半导体材料的带隙宽度可以从3.4eV到6.2eV连续可调,覆盖了从365 nm到200 nm的紫外波段,是制备紫外短波长发光和探测器件不可替代的材料体系。利用高Al组份的AlGaN材料制备的本征日盲紫外雪崩探测器可以省去昂贵的滤波片,即使在很强烈的太阳背景下也可以探测到非常微弱的日盲紫外信号,而且它还具有低的工作电压、低功耗、更小的尺寸、易于集成等优点,因此有可能替代目前广泛使用的体积庞
随着网络技术的发展和移动设备的广泛的应用,极大的提高了为用户“随时随地”的提供所需服务或是信息的能力。在这样的背景下,基于情境感知的信息推送服务得到了越来越多的关注,成为了近年来一个研究热点。同时,用户对自适应的信息服务的需求也越来越迫切。鉴于移动用户所处的环境是动态多变的,因此给研究者们提出了这样挑战:如何设计能够支持开发具有自适应性的、情境感知系统架构?使系统能够主动为用户提供信息服务的同时,
硅基半导体材料与技术是现代微电子产业与信息社会发展的基础,是关系国计民生、国家核心竞争力的技术保障。2017年我国进口 2601亿美元的集成电路芯片,2018年进口额更是突破三千亿美元,达人民币~2.1万亿,超过原油等大宗商品买卖。因此,加大硅基半导体的研发与投入,探索具有自主知识产权的高性能硅基半导体器件显得尤为重要。硅与锗是电子信息领域最重要的两种半导体材料,1947年贝尔实验室研制出首个晶体
随着各国工业化进程的加快,人类对水资源的非航行利用急剧增加,世界淡水资源日益匮乏,水资源的加速利用又带来了严重的水污染问题,水质的逐渐恶化又进一步加剧了水短缺问题,各国围绕跨界河流水资源利用与保护的摩擦、冲突和争端不断发生,如何公平、合理、最佳利用跨界河流水资源,缓解淡水匮乏危机,避免跨界水冲突,促进跨界河流利用与保护合作是目前国际社会共同面临的课题。中国的跨界河流数量众多,分布广泛,中国在这些跨