面向图谱分析的表示学习技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:rrtaobao123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图谱数据是一种重要的数据表示,它出现在各种各样的现实世界场景中,例如,社交网络中的社交图谱,研究领域中的引文图谱,知识图谱等。有效的图谱分析可以使用户更深入地了解数据背后的内容,从而使许多现实中的应用受益,如推荐系统,自然语言处理,可视化等。但是,大多数图谱分析方法都会遇到计算效率低下和空间代价高昂的问题。图谱表示学习,是解决图谱分析问题有效且高效的方法。它将图谱数据映射到低维空间中,最大程度地保留了图谱结构信息和图谱的属性。本文的研究侧重于图谱表示的两种主要学习技术,即网络表示和知识表示学习技术。现有的图谱表示方法面临着计算效率低下和数据稀疏的问题。特别的,现有的网络表示模型也无法处理异构信息网络,这些信息网络在真实场景中比同构信息网络更常见。具体的,本文提出了四个图谱表示模型来解决上述问题,一个用于同构信息网络,两个用于异构信息网络,一个用于知识图谱。首先介绍同构信息网络表示模型BimoNet,该模型基于双模式表示模型和深度神经网络模型。在双模式表示模型中,加法模式和减法模式分别表示边的实体共享特征和实体特定特征。深度自编码器可以表征边的结构信息。之后,通过联合优化这两个模型的目标函数,BimoNet可以保留边的语义和结构信息。在实验中,采用的数据集是一个同构信息网络,它是作者研究领域共享网络,唯一的节点类型是作者。最后在关系提取的基准任务上评估BimoNet。然而,相较于同构信息网络,异构信息网络更为广泛地存在于现实世界的图谱数据中。因此,提出了一种新的异构信息网络表示模型TransPath,它将位移机制与元路径结合在一起。将元路径视为路径中第一个节点至最后一个节点的位移操作。此外,提出了一种用户引导的元路径抽样策略,将用户的偏好作为引导,可以更精确地探索路径的语义,同时通过避免其他噪声和无意义的元路径的干扰来提高模型效率。在两个大型真实数据集DBLP和YELP以及两个基准任务相似性搜索和节点分类上评估所提模型。元路径的表示能力仍然有限,因为当使用路径捕获两个节点之间的邻域结构时存在明显的信息丢失。因此,提出了一种新的机制,通过元图谱捕获节点的特征,这些特征保留了比路径更多的语义和结构信息。模型将节点和元图谱构建为异构信息网络三元组,然后应用Hadamard函数来编码节点和元图谱之间的关系,并且可以评估异构信息网络三元组是否为正的概率。此外,为了更好地区分元图谱对称和非对称情况,引入了一种复数表示的机制,它能够精确地表示异构信息网络节点。最后在真实数据集上评估所提出的模型metagraph2vec的有效性。本文还提出了一个名为Bi-Mult的新知识表示模型,它利用动态双模式表示机制来表征知识图谱并结合了组合模型和位移模型的优点。在双模式表示模型中,实体(关系)表示被分解为两部分,一部分表示实体(关系)的内在状态,另一部分表示实体(关系)的交互状态。双模式的关系表示增强了关系与实体的相互作用,从而增强了模型处理非对称关系的能力。此外,通过映射矩阵将双模式表示的实体应用在位移模型中,构建了用于表征复杂关系的动态表示模型。在实验中,在基准数据集和基准任务链路预测上评估所提模型。总之,许多研究提出了图谱表示学习技术来分析图谱数据背后所隐藏的丰富信息。然而,传统的图谱表示模型存在计算效率低下和数据稀疏性问题。为了解决这些问题,本文提出了四种新的图谱表示方法,更具体的,网络表示和知识表示方法,它们都提供了一种新的角度来实现图谱的表示学习。在实验中,所得结果验证了算法和模型的有效性。
其他文献
随着我国经济的高速发展与消费者需求的逐渐扩大,连锁便利店作为一种具有普遍性的零售业态,迎来了发展的黄金期。便利店数量与规模的扩大极大的满足了消费者的中、小规模购物
高技术产业作为承载科技创新活动的重要着力点,其创新产出标志着国家科技发展的先进性与前瞻性,决定着中国的国际地位与生产力水平。目前而言,我国的技术创新能力的增强将依
随着科学技术的发展和生活水平的不断提高,人们对服务类机器人产品的体验越来越重视,但由于市面上产品的同质化严重且在技术层面受到限制,所以体验成了服务机器人产品设计的关键因素。从用户体验的角度探究商场应用场景下服务机器人产品的设计,充分将用户与产品融合,通过产品传达给用户更多的情感及愉悦的体验,探索出适用于现况的商场导购服务机器人设计方法。首先对用户体验的概念、用户体验层次模型、设计原则等基本理论进行
学位
随着我国经济的发展,我国农村劳动力的城镇转移规模也在不断增加,但仅有少部分的农村劳动力真正实现了转移。在当前农村社保制度以及农地流转市场缺失和不完善的背景下,农地
能源是人类赖以生存的物质基础,在社会发展中扮演着重要的角色。作为能源大国,能源是我国经济持续、快速、健康发展的奠基石。然而,我国能源消费量持续增长,居高不下。伴随能
央视《等着我》作为一档大型公益寻人电视节目,借助国家力量,为普通老百姓实现团圆梦。自2014年开播以来,因《等着我》节目本身纯公益、无明星、低娱乐性,仅通过真情实感的故
近年来我国人口老龄化问题日益严重,居民养老问题突出,多层次的养老保障需求给养老保障体系第三支柱中的商业养老年金保险提供了有利的发展机遇,大力发展和推广商业养老年金
2007年末,河南省65岁及以上人口总数为747万人,占总人口比重为7.6%,河南已进入老龄化阶段。截至2018年,河南省65岁及以上人口总数上升至1019万人,比2007年增加272万人,在总人
儿童时期是孩子一生中的发展关键期,家庭中较好的成长发育环境,更有利于儿童在该时期得到良好的启蒙式教育。当代家长为了让孩子从小赢在人生的起跑线上,从而致力于孩子运动能力、思维能力、语言能力等多方面能力的锻炼培养。在童年生活中,儿童或多或少都会接触到一些形态各异的儿童类产品,该类产品在儿童的成长过程中,主要起到陪伴儿童玩耍的作用。其中,儿童平衡车作为学龄前儿童最喜爱的运动方式之一,不仅受到了儿童的热烈
学位
多年来,基于准时化(JIT)生产的混流装配线排产优化问题研究一直是学术界和企业界研究复杂组合优化问题中的重点和热点,这方面取得的成果和成就也比较多。然而我国还有不少企业的混流装配线采用的是基于非准时制的生产模式,即用于装配的零部件才刚生产完或者正在生产,而不是开始装配前所有的零部件都已准备完毕。此种模式下的排产优化问题鲜有学者研究,尤其是带有缓冲区约束的复合型混流装配线排产优化问题,它是柔性流水车
学位