知识库问答中基于图匹配的问句理解技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:plm0plm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱技术的快速发展使得海量的知识和信息能够被结构化地存储和查询,这使得人们搜索信息的途径不再局限于传统基于字符关键词匹配的搜索引擎,知识库问答技术为此提供了新的解决方案。然而人们输入的自然语言问句不能直接地被知识图谱所理解,需要先将自然语言解析为计算机能够执行的形式。本文将问句理解任务分为信息抽取和信息消岐两个子任务来进行研究,本文所研究的图匹配方法是将知识子图与问句进行相似度匹配。针对信息抽取任务,提出了基于表卷积神经网络的实体关系联合抽取模型,用于抽取出句子中包含的实体和关系形成知识子图。针对信息消岐任务,结合粒计算的思想,提出了基于语义超图匹配消岐的问答方法。两种方法相结合能够将包含多关系的复杂自然语言问句与知识图谱进行匹配,得出正确的问句理解查询图,从知识图谱中查询出正确答案完成问答任务。本文主要工作如下:1.提出了一种基于表卷积神经网络的实体关系联合抽取模型ETC,该模型能够对自然语言输入中的实体和关系进行联合抽取。首先通过神经网络和条件随机场学习生成句子的初始特征表,随后利用本文所提出的表卷积神经网络层学习词语对之间的依存关系信息生成新的特征表,最后通过表填充的方式预测词语的实体类型和词语对之间的关系类型,能够避免在得分图上进行复杂的搜索计算。为了验证模型的有效性,本文在手工标注数据集Co NLL04和远程监督数据集NYT上进行了实验,与现在流行的方法进行了对比,ETC在命名实体识别,关系分类和联合抽取任务上都取得了较为优秀的结果。2.在信息消岐任务上提出了一种基于语义超图匹配消岐的问答方法。该方法首先对问句进行信息抽取,并融合知识图谱信息构建语义超图,随后利用先验知识构建多粒度上下文特征对语义超图中的实体进行初步消岐,最后通过语义相似度匹配,字面相似度匹配,和关系相似度匹配相结合的排序策略逐步进行推理消岐,获得复杂多关系问句的最终理解结果,能够有效地提升问答系统的效率和准确率。在中文问答数据集CCKS2019-CKBQA和NLPCC-ICCPOL 2016上进行了验证实验,与任务最优方法相比,在不使用人工设计的规则模板或多问答模型融合的情况下,取得了最优实验结果。
其他文献
目的:评估生长激素(GH)联合治疗对不孕患者中的卵巢低反应人群(POR)在接受IVF/ICSI治疗时的结局的影响,探究生长激素在临床上辅助生殖相关应用的适应症,从而进一步明确生长激素在辅助生殖领域的应用前景。材料和方法:回顾性分析2010年1月1日-2014年12月31日期间在浙江大学医学院附属妇产科医院接受IVF/ICSI治疗的225例卵巢低反应(POR)中国女性不孕患者的临床资料。以上所有入组
超冷原子分子的研究是超冷量子气体领域的一个前沿课题,具有非常重要的理论价值和广阔的应用前景.该研究广泛应用于强相互作用超流、相干分子光学、精密测量、凝聚态物理等领
随着现代科技的发展,公共场合的服务机器人在政策引导和市场吸引下大量涌现,具有为宾客引路功能的引导服务机器人从很大程度上影响着人们的生活方式。引导机器人在执行引路任
云服务器提供了快速便捷的数据存取服务,将数据上传到云端,可减少用户的数据存储和维护开销。为了保护数据隐私,数据拥有者可将数据加密后再上传到云端。但用户无法直接在密
在地产市场竞争日益激烈的环境下,行之有效的履约评价能够更好地帮助地产企业正确、科学地对承包商履约进行评价、选择优质的承包商。履约评价在地产企业管理中起着举足轻重
无标定视觉伺服是近些年的一个热点研究方向。在无标定视觉伺服中一个主要问题是如何求取反映图像空间与机器人操作空间之间映射关系的图像雅可比矩阵(Image Jacobian Matrix
遥感技术和地球物理探测技术在考古领域的应用中各有特点,所形成的考古数据也存在多种类型。然而由于各种探测数据缺少统一的管理和分析平台,给数据之间的交互和综合分析带来
随着信息网络技术的发展,无线传感器网络(Wireless Sensor Network,WSN)在日常生活、农业生产等众多领域得到了广泛的应用,前景十分广阔。WSN是由随机部署在监测区域的传感器节点组成,是一个以数据为中心、自组织的网络。但传感器节点是硬件受限设备,节点能量有限且无法补充,所以减少节点能量消耗,最大限度的延长整个网络的生命周期十分重要。而分簇路由协议作为无线传感器网络中有效的能量优
甲状腺结节作为最常见的甲状腺临床疾病,近年来发病率不断攀升,严重影响着人体健康,对甲状腺结节辅助诊断开展研究极具现实意义。超声检查是甲状腺结节临床诊断的必要检查方
随着5G网络在部分城市的试运行,互联网行业又进入新时代,面临5G网络带来的高爆发流量,现有的网络架构及网络规模的在数据转发存储的性能上已经出现了瓶颈。软件定义网络架构的出现,实现了数据平面与控制平面的分离,集中式的控制管理,开放式的资源统一调配。多粒度光交换网络融入软件定义网络架构中,实现软件定义网络平缓的向软件定义光网络发展。首先,该文在计算链路权重的过程中,引入数学概率模型,使用光码链路容量类