基于查询图的知识图谱问答研究

来源 :苏州大学 | 被引量 : 0次 | 上传用户:lucas_f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱问答以结构化的知识图谱作为答案来源回答用户提出的自然语言问题。在已有的知识图谱问答方法中,基于查询图的方法广受关注。基于查询图的知识图谱问答方法包含查询图生成和查询图选择两个主要模块。其中,查询图生成实现问句的语义解析,将问句转换为一组候选查询图;而查询图选择是从候选查询图集合中选出最优查询图,并从知识图谱中检索答案。尽管基于查询图的知识图谱问答方法取得了一定的进展,但其在复杂问句的语义解析以及问句和查询图语义匹配中仍面临一定挑战。本文对查询图生成和查询图选择分别展开研究,主要内容包括如下:(1)节点与边联合约束的查询图生成方法针对已有查询图生成方法在复杂问句解析中的局限性,本文提出一种结合节点约束和边约束进行查询图生成的方法。该方法通过引入基于边的搜索操作、边约束挂载以及组合操作,能够更准确地生成查询图候选。此外,本文构建了一个包含多种复杂问句类型的中文知识图谱问答数据集。在两个基准数据集上的实验结果表明,所提查询图生成方法明显优于已有方法,并提升了问答系统的最终性能。(2)基于全局排序的查询图选择方法本文提出基于全局排序的查询图选择方法以进行最优查询图选取。首先将查询图转换为序列,使得问句和查询图的匹配问题转换为两个序列之间的匹配问题。然后采用预训练语言模型编码问句和查询图序列并引入两者之间的交互信息。最后通过结合正例查询图和负例查询图的关联进行得分优化。在中英文数据集上的实验结果表明,基于全局排序的查询图选择方法取得了良好的系统性能。(3)基于重排序的查询图选择方法已有的查询图选择方法通常基于单阶段排序的方式,这种方式在top-1性能和top-k性能之间存在较大差异,即许多正确的查询图能排在前列,但不总是排在第一位。针对这个问题,本文提出重排序方法,针对top-k数据进行二次排序。在重排序过程中,一方面依据第一阶段的排序结果进行数据重采样,另一方面引入答案类型信息设计新的编码方案。在中英文数据集上的实验结果表明,采用重排序方案能够缓解单阶段排序造成的错误情况,进一步提升系统性能。(4)基于查询图的中文知识图谱问答系统中文知识图谱问答系统大多基于信息检索的方法,并且能够处理的问题类型相对有限。本文在上述研究的基础上构建基于查询图的知识图谱问答系统,实现了一个更可靠的在线问答系统。综上,本文针对知识图谱问答任务首先提出一种查询图生成方法来更好地解析复杂问句,并且构建了一个复杂问答数据集验证查询图生成方法的有效性。然后研究基于全局排序的查询图选择方法,并进一步提出基于重排序的方法。最后通过结合上述三点内容构建一个中文知识图谱问答系统。
其他文献
核技术水平是一个国家地位和综合国力的重要体现,目前惯性约束激光核聚变(Inertial Confinement Fusion,ICF)是人工可控核聚变的主要方式之一。因其高效、可靠等优点,现已成为各国对寻找未来核聚变清洁燃料和新型武器的研究焦点。微操作和精密装配是完成ICF靶器件组装的关键技术,该靶器件所包含的零件复杂、尺寸跨度大(50μm到5mm),不同零件之间所需的检测装配力要求也是跨数量级的
学位
随着国内集成电路产业的迅猛发展,客户及市场对芯片产品的高质量、低成本的要求越来越高,使得企业质量管理能力的高低将直接影响产品推向客户及市场的成败。产品研发投入成本增加,产品质量不适应客户需求,必将影响了产品竞争力,终将会影响到产品是否能够推向客户及市场,这是关乎企业未来的发展重要因素。本文以DMT公司为例,研究IPD模式下芯片产品类研发项目质量管理的改进方案。在综述相关理论和研究成果基础上,深入分
学位
本文以THB公司“雅江特高压”项目为例,对项目型生产企业的项目质量管理过程及方法进行了研究。从项目质量管理的三个过程:规划项目质量、项目质量保证、项目质量控制分别着手,对项目型生产企业在项目质量管理过程中的特点、现状、存在的问题进行阐述,并针对现状和问题分别给出了对策。本文还重点介绍了质量工具在项目质量的不同过程中的作用,并详细阐述了几种质量工具的实际应用,以及这些质量工具对项目质量的作用。例如,
学位
中文篇章分析作为自然语言处理领域中一项基础任务,旨在将中文篇章平文本以树形结构表示,称作中文篇章修辞树结构。篇章修辞树有助于从整体上把握篇章行文脉络并提供结构化信息,对下游篇章级别的文本分类、文本摘要、情感分析和机器翻译等任务具有基础支撑的作用。随着汉语连接依存树结构语料(CDTB)的发布,基于中文的篇章分析研究得以开展。近年来,深度学习技术在自然语言处理领域中多项任务上取得显著成效,因此在篇章分
学位
离心泵是石油化工生产中的重要设备,而对于高温油泵来说,密封性能的好坏直接影响到整个工厂的安全生产,大部分离心泵采用的是机械密封,在石油化工企业中输送的介质大多数具有腐蚀性、易燃易爆性及毒性,一旦高温油泵机械密封失效会引起火灾、中毒等涉及人身伤亡的重大事故,因此,机械密封泄漏原因与解决措施的研究就尤为重要。本文以常减压装置的常压渣油泵为研究对象,从腐蚀、机械磨损、力的作用方式以及变形等方面对机械密封
学位
搅拌摩擦焊(Friction stir welding,FSW)技术中焊接质量与成本都是关注的焦点,一方面搅拌头的工作寿命对焊接成本和焊接质量有影响,另一方面焊缝内部温度场会影响最终焊接质量,所以搅拌头寿命及焊缝内部温度的测量都十分重要。大量研究工作表明,FSW焊接过程中热量主要来源于搅拌头与工件的摩擦,因而搅拌头与工件的接触界面温度测量尤为重要。基于上述,本文设计了用于FSW的高寿命测温搅拌头,
学位
氨基酸变异的耐受性,指的是蛋白质对其位点上发生的氨基酸变异的容忍程度。耐受性高的变异通常对蛋白质功能没有影响,也被简称为中性。相反,耐受性低的变异大概率有害,其中发生在人类蛋白质上的低耐受性变异常被称为致病变异。用计算方法预测变异耐受性比实验方法预测速度快、成本低。已报道的研究方法仅集中于对人类物种中发生的氨基酸变异的致病性进行预测,尚缺乏对多物种氨基酸变异耐受性预测的模型。本文拟采集多物种氨基酸
学位
随着移动互联网的快速发展,网络中的数据量正在以指数级别快速增长,信息过载问题则随之出现,该问题导致用户很难从互联网海量的产品或服务中找到自己真正感兴趣的。为了提升用户的体验以及企业的经济效益,推荐系统应运而生。一个有效推荐系统的核心是能根据用户历史交互准确建模用户偏好,并根据用户偏好来个性化地向用户推荐物品。现代推荐系统虽然蓬勃发展,但始终受数据稀疏和冷启动问题影响。作为图神经网络的一种,超图神经
学位
视觉对话是一种跨模态数据交互任务,该任务是基于一幅给定的图像以及多轮对话历史让AI agent(代理)回答给定的问题,形成一段围绕图像内容展开的连续对话。本文针对现有方法因未关注到不同模态之间的交互信息而无法完成跨模态指代消解问题,分别从视觉和文本角度进行跨模态指代消解,同时提出新的表征机制将不同模态提取的特征进行更好地融合学习。主要研究内容如下:(1)针对视觉与文本模态缺乏交互性而导致的视觉目标
学位
随着智能手机的普及以及移动互联网的发展,空间众包成为了共享经济时代下传统众包发展的新方向。空间众包的核心操作是任务分配,即将具有时空特征的任务分配给空闲的工人。多个空间众包平台的存在使得合作成为可能,各平台以共享任务与工人的方式进行合作,帮助其他平台完成原本难以完成的任务,从而实现更优的任务分配以及总收益的扩大。此外,空间众包平台也能利用大数据来驱动更智能的任务分配,基于联邦学习技术共享各自的数据
学位