面向多跳推理的自然语言与知识图谱融合方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:rainxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱(Knowledge Graph,KG)是以三元组为组织形式的多关系异构图,由于其有效的提供了对知识的管理、存储与挖掘的手段,被广泛的应用于推理研究中。多跳推理属于复杂推理的一种,其任务是通过给定实体与多跳关系路径推理出尾实体,在智能搜索与问答等领域有着重要的研究价值。然而现实应用中多以自然语言输入为主,难以直接建模自然语言问题中的关系语义以适应于多跳推理模型。此外,现实世界中知识图谱的规模极大,结构复杂,其稀疏性和不完整性更是降低了推理算法的可靠性。如何将知识图谱的结构特征与自然语言关系语义相融合,增强多跳推理的能力是有挑战意义的。鉴于上述问题,提出了一种面向多跳推理任务的自然语言与知识图谱的融合模型。首先设计了一种基于关系链接的限制子图算法,该算法通过关系链接模型抽取关系集合并使用改进的广度优先搜索算法降低知识图谱的规模。融合模型分为两个模块,结构融合模块在图传播过程融合自然语言语义以增强图神经网络的编码性能,增加关系注意力机制使实体表示能够感知不同关系的贡献度,最后将实体表示用于计算实体得分来筛选候选实体。关系链路推理模块通过抽取关系路径进行监督学习,使用双向长短期记忆网络和注意力机制编码关系路径,计算与自然语言的关联得分得到最终多跳推理结果。为评估算法的有效性,采用Meta QA电影数据集和Web Question SP通用数据集对算法进行测试。实验结果表明,限制子图算法能够高效的提取知识图谱子图,在拥有相同子图覆盖率的同时将子图规模降低一个数量级。在多跳推理任务上,融合模型在两个数据集上的Hits@1指标分别提高了5%和1%,且可扩展到大规模知识图谱。
其他文献
文本分类是自然语言处理中的一个重要任务,在文本相似性分析、问句匹配以及自然语言推理等应用中都发挥着重要作用。新闻分类是文本分类中一个热点问题,受到了研究者们的广泛关注。新闻文本因其结构层次的差异性、标签种类的多样性以及高质量标注样本数量的有限性,相比于普通文本,在分类处理上更加具有挑战。通过分析新闻分类中的难点,以卷积神经网络文本分类模型与长短期记忆网络文本分类模型为基础,提出一种基于层次语义与先
学位
新课程改革背景下,要求教师发挥数学课堂育人价值,促进学生核心素养的发展。基于此,教师要重视数学活动、变式训练、思想点化的作用,创新课堂教学模式,发展学生的核心素养。
期刊
跌倒是全球第二大意外伤害死亡原因,在跌倒后及时进行救治,可以极大地减少由意外带来的伤害和损失。传统的跌倒检测方法主要基于可穿戴设备或光学设备,在使用场景或舒适性上受到了很多的限制,而利用无线信号的信道状态信息(Channel State Information,CSI)可以实现无接触的跌倒检测。近年来,虽有许多工作提出了基于CSI的无接触跌倒检测方法,但是这些方法容易受到环境变化的影响,在部署至新
学位
脊柱生理曲度和侧弯是脊柱畸形评估的关键指标,在临床诊断中往往需要对受检者进行X光片拍摄后由医生手动进行指标测量,具有一定的危害性和不确定性。使用深度相机捕获人体图像,并开发一套脊柱畸形检测系统,能够帮助医生快速、准确、无害、高效地诊断脊柱畸形。运用深度学习和图像处理相关技术,设计并实现了一套脊柱畸形检测系统。该系统使用Kinect相机采集人体背部表面的深度图像和彩色图像,采用区域生长的方法提取人体
学位
<正>《数学课程标准(2022年版)》指出:“数学在形成人的理性思维、科学精神和促进个人智力发展中发挥着不可替代的作用。数学素养是现代社会每一个公民应当具备的基本素养。”为有效地提升学生的数学素养,转变学生的学习方式,让学生进行审辩式学习是一种有效的途径。穆传慧老师对审辩式学习进行了系统研究,从一个中心、两个理念、三类素养、四种思维、五学课堂、六项评价等维度进行有理念、有工具、有正确价值观的结构性
期刊
信息物理系统是一种以传感器作为终端设备,感知外部坏境变换,并针对外部环境变化做出响应的计算机系统。在一些特殊场景中,系统所监视的外部对象具有可容忍响应时间属性。一旦所监视对象的状态发生了改变,系统需要在可容忍响应时间内,完成对于此变化的响应。例如,一旦高压电线路中的电压超过额定值,高压电监控系统需要在10毫秒内完成断电操作。现有信息物理系统响应时间控制策略均以降低系统平均响应时间为设计目标,不支持
学位
随着互联网时代信息体量的爆炸式增长,投资者难以快速从海量的金融新闻文本中获取有价值的投资信息。论文以金融新闻文本为研究对象,对事件抽取技术展开了深入地研究,构建了一个面向金融领域的新闻事件抽取系统,以便帮助投资者从海量的新闻文本中快速获取上市公司事件信息。主要的研究工作如下:提出了基于注意力机制的联合事件抽取算法。该算法使用ERNIE与BiGRU作为共享编码层,通过序列标注的方式识别出触发词之后,
学位
近年来,图神经网络由于其强大的表征提取能力在包括推荐系统在内的许多领域得到了广泛应用。目前,一些基于图神经网络的推荐算法利用评论等辅助信息在一定程度上改善了评分稀疏的问题。但是,现有算法很少关注评论中多方面的评价信息,通常从文档级别的文本中提取用户和物品的表征,难以准确捕获细粒度的特征。仅使用标点符号对评论进行分割无法准确提取不同方面的评价信息。一方面,使用标点符号粗分后的短句中仍可能存在不同方面
学位
随着操作系统国产化的不断推进,依托开源生态,涌现出了大批以Linux为内核的国产操作系统。而目前Linux上的图形用户系统基本都是以X架构为主,由于X架构上的一些缺陷,导致国产操作系统中基于X的图形显示系统存在系统占用资源高、渲染效率低下等问题。为提升国产平台的人机交互显示能力和系统整机效能,以国产嵌入式Linux操作系统和龙芯3A系列处理器为平台,设计并实现了一个基于Wayland协议的轻量级图
学位
随着资源描述框架(Resource Description Framework,RDF)成为描述知识图谱、图数据等数据资源的统一描述标准,RDF数据的规模急剧增加。在单机上查询大规模RDF数据性能受限,难以满足用户的需求。因此,分布式处理大规模RDF数据成为研究的热点。分布式处理RDF数据首先面临的挑战是如何合理均衡地将数据分发到各计算节点上。广泛使用的集中式划分所能处理的图数据规模有限,不能处理
学位