基于图嵌入和图卷积的无监督对抗图对齐

来源 :厦门大学 | 被引量 : 0次 | 上传用户:maybeen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图对齐,亦被称作节点对齐,旨在多个社交网络平台中找到在现实生活中属于同一个自然人的用户。它是社交网络分析中的一个基本任务,近年来在跨知识图谱领域及自然语言处理领域中均有涉及。传统的图对齐方式虽然凭借着愈加强大的计算资源取得了一定的进展,但是它们大都依赖于训练数据与测试数据需要存在部分对应节点,即所谓的锚链接。这些数据的获取会涉及到安全问题例如用户隐私等,若直接对各种图网络数据手动标记对应节点会给实际应用带来局限,因此,如何构建对应节点是图对齐在实际应用中的挑战。本文针对图数据本身的特点,在没有任何锚链接的情况下,开展对齐两个图的研究,达到既保留图自身的特征信息,又无需图之间的锚链接的目的。本文基于图本身的性质提出了两个框架独立解决无监督图对齐的问题:其一是基于图嵌入的无监督对抗图对齐框架,通过完全无监督的方式,即没有现成的锚链接并且没有节点的属性信息或其他资料可用,来进行两个图的节点向量空间的跨域对齐;其二是基于图卷积的无监督对抗图对齐框架,通过图卷积网络将节点特征向量和对抗网络直接结合,实现端到端的训练。本文进一步将两种框架扩展成为增量式,它可以通过伪锚链接也就是模型的输出结果重新训练获得不曾观测到的用户链接。同时这可以形成正反馈来进一步提高节点向量的质量和对齐精度。本文通过引入对抗训练对两张没有任何相关信息的图进行高效的伪链接标注,有效减轻了对大规模数据的标注压力。增量式框架即本文挑选置信度最高的高相似度节点构成节点对,同时通过对齐双向节点来选择可靠的高置信度图内节点对加入训练集,在为模型提供新特征的同时也缓解原始训练数据的信息过少的问题。论文所提方案在公开社交网络数据库Last.fm,Flickr,Myspace和文献数据库Cora,Citeseer上分别进行实验,较传统的无监督方案在图对齐任务上的对齐精度平均提升了 40%,同时省去了大量的人工标注时间。除了应用于社交网络,本文所提模型还可用于其他图数据对齐的应用,例如药物开发、图像匹配等。
其他文献
目前用于硅基太阳能电池的太阳能级硅铸锭主要有两种切割方式,一种是传统的砂线切割法,另一种是新型的金刚石线切割法。后者由于切出的硅片质量好、切割过程效率高,逐渐成为主流的切割方法。但在切割过程中约有40%高纯硅变成切割粉废料,并造成环境污染。将这些废料中的高纯硅进行有效回收再利用成为亟待解决的问题。本论文采用两步法烧结和冶金法两种工艺对切割粉进行回收与纯化,系统地研究了切割粉的回收过程中的烧结机理与
磁共振成像(magnetic resonance imaging,MRI)凭借其无电离辐射的特性以及良好的软组织分辨能力自提出以来就受到了广泛的关注并得到了飞速的发展。然而,目前的磁共振成像多为定性的参数加权成像,仪器、脉冲序列的不同都会造成成像结果的差异,这制约着磁共振成像更深层次的应用。磁共振定量参数成像可以有效解决这一问题,但常规的定量参数成像需要较长的采样时间来完成多次数据采集,导致其对运
随着检察机关司法责任制改革以及检察机关内部机构改革后“捕诉一体”办案模式的实行,检察机关内部权力“下放”程度进一步加大,检察官的主体地位日益凸显,权力不断增强。这使检察机关在履行法律监督等一系列职能的同时也面临着如何防范自身恣意和滥权的问题,因而有必要不断探索完善检察机关的内部监督机制,以减少甚至杜绝检察机关内部的执法失范问题,但有一点必须明确,即加强检察机关内部监督时,必须以坚持检察官办案主体地
基于LED(Light-Emitting Diode)的固态照明技术是21世纪最具发展前景的一项新兴高技术行业。但是LED在热学特性方面仍具有诸多挑战,因此探究可靠的LED结温测试方法一直是LED领域的热门话题。目前常用的LED结温测试方法分为接触式和非接触式两种。前者容易影响LED工作状态,后者大多只能获取区域内的平均温度。本文针对上述需求,提出了一种基于显微高光谱反射光法的LED二维结温检测技
社区聚类算法也叫图聚类算法,一直以来都是数据挖掘领域研究的热门话题。如最大模块化算法、SCAN算法,都可以从复杂的结构图中将联系紧密的社区结构有效剥离开来。在大数据爆发的今天,这些算法仍能解决社区划分的问题。该类算法的研究对于商业应用中的导购推荐、话题的舆论导向等等有着非凡的意义。然而,针对某一个物品或者某一服务,人们会有不同的情感,通过这类算法所得到的社区结构并不能真正反映现实生活中的社交关系。
梁拱组合体系桥梁结合了拱和梁的特点,竖向刚度大,对地质条件要求低,同时跨越能力强且造型美观,在桥梁建设中尤其是在城市桥梁中应用广泛。钢-混组合梁结合了两种材料的优势,而且便于施工,目前在桥梁建设中得到大力推广。本文以一座跨径35m+100m+150m+100m+35m的五跨连续中承式钢-混组合梁钢拱桥为工程背景,基于有限元分析软件Midas/Civil建立全桥的全过程仿真计算有限元模型,研究了钢-
随着城市化进程的加快发展,城市建筑物密度不断增加,建筑排布错综复杂,呈现高大密集的特点,致使城市下垫面变得更为粗糙,导致城市风速普遍呈现减小、污染物难以扩散,或者高大建筑间出现“峡谷效应”。所引起的城市风环境问题如空气污染、城市热岛效应、峡谷效应等越来越突出。所以,对城市风环境问题进行深入系统的研究,具有重要的理论和现实意义。本文通过CFD数值模拟、风洞试验等方法对城市风环境的污染扩散等问题开展系
随着移动互联网与物联网的发展,在各个领域中有大量的数据需要被快速的传输或者存储。为了尽可能提高数据的传输效率,减少存储空间,对数据进行压缩处理是必要的操作。而有损压缩技术能够在尽量保证信息可靠性的情况下,用尽可能低的码率去传输信息,对信息系统的发展有重要意义。而量化作为有损压缩的主要方法,是有损信源编码问题的关键。有损信源编码作为信道编码的对偶性问题,作为信道编码中常用的低密度校验(low-den
F地铁公司运营3年多,工程车检修班组仍处于经验管理阶段。随着运营线路增多,专业检修人员缺乏,工程车检修班组面临无法高效运作、检修质量不稳定、班组管理标准不明确等问题,尚未形成一套标准的班组管理模式,影响地铁的安全运营。为了减少班组管理问题给地铁运营带来的安全风险,F地铁公司意识到工程车检修班组标准化建设的紧迫性。地铁工程车检修班组标准化建设,不仅有利于提高班组的管理水平,而且能为后续线路提供一套短
近年来计算机视觉的技术发展迅速,在目标检测和目标跟踪领域有一些重要成果,解决了许多产业链上的问题,比如车牌识别、缺陷检测等。在海洋生物学的研究中,大量科研工作中仍采用人工处理数据的方式,使得数据的处理耗费大量的时间和资源。本课题选择对虾和鲍鱼作为主要的研究对象,其一研发对虾跟踪系统跟踪对虾运动情况。其二是研发鲍鱼体型参数图像测量系统。本文的主要工作内容如下:(1)为研究对虾在不同条件下的运动特征,