自然问句分析与SPARQL查询生成方法的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:johnlu2828
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着结构化知识数量不断的增长,以RDF格式存储的知识库也被广泛应用于不同的领域,导致终端用户对于访问这些知识的需求也在不断增长。同时问答系统也正受到越来越多的关注,比起传统的搜索引擎检索,问答系统通过自然语言提供对数据的直接访问,并且能够保证终端用户不受数据建模、词汇表和查询语言技术方面的影响。终端用户与问答系统的交互通过输入自然问句获取精确且简洁的答案,比访问网页进行寻找答案更加方便。但是对利用知识库作为底层数据存储的问答系统无法通过关键字匹配的方式访问数据,而是需通过结构化查询语言访问获取对应的数据。而这一类查询语言需要专业人士才能正确地编写,因此在面向知识库的问答系统中解析自然语言并生成结构化查询语言成为了一个热点。本文提出了语义解析的深度问答和面向自然问句的SPARQL查询生成方法,结合问句分析技术包括句法结构分析和依存关系分析,获取问句中词语之间的语义关系。通过提出语义查询图模型标注问句的主题词语、识别问句的实体词语和类别词语和抽取问句中的语义单元以及构建关系三元组结构。为了将自然语言映射到知识库资源,提高实体链接的准确率,本文采用了基于知识库的实体链接方法,使用Wikipedia构造外部实体指称字典和关系指称字典,最后结合知识库进行实体和谓词路径的匹配,优化语义查询图。为了匹配问句对应的SPARQL查询模式,采用基于Bi-LSTM的问句分类的方法获取问句的类别,在SPARQL查询生成阶段选择正确的查询模式。针对目前问答系统存在对复杂问句的准确率不高的问题,本文使用问句分解技术对复杂可分解的问句进行分解并重写子问句,然后对子问句进行分析处理,简化复杂问句的处理过程,从而提高解析复杂问句的准确率。最后,根据上述的解决方案本文设计并实现一个面向知识库的问答系统,实现了对问句的语义解析、问句分类和问句分解等问句分析功能,获取用户的查询意图。然后基于依存分析的结构定义语义查询图模型,并实现自然问句到语义查询图的转换。最后通过遍历语义查询图和SPARQL查询定义实现基于语义查询图的SPARQL查询生成,然后利用SPARQL查询引擎对生成的SPARQL查询语句进行检索并返回答案,最后通过一个可视化界面完成与用户的交互。该问答系统在QALD和WebQuestion数据集中的F值能达到83%,相比于AskHow、ONIL、QuerioDaLI和Xser这些面向自然语言问句查询生成方法性能有较大提升。
其他文献
随着时代的进步,经济的发展以及我国城市化进程在不断的加快,带动了整个建筑业的发展,与此同时,随着现代建筑质的提高及量的逐渐加大,对建筑业也提出了更高的标准和要求,很多
做好毕业生的心理调节工作汪中洲大学毕业生的就业,是高校与社会相衔接的重要环节,他是检验高等教育是否与社会相适应的晴雨表。因此,卓有成效地做好毕业生就业工作,对我国现代化
目的探讨重组人干扰素α-2b凝胶治疗高危型人乳头瘤病毒(HR-HPV)感染的效果。方法选取2014年4月至2015年12月在该院进行诊治的64例HR-HPV感染妇女,检测HR-HPVDNA载量,分析其与宫
目前,研究高盐等逆境胁迫下细胞的抗逆应答机理成为生命科学的热点之一,各种新的研究技术与研究成果不断涌现。转座标签技术是根据转座子随机引起插入突变的特性而发展起来的
WRKY蛋白是一类存在于高等植物中的转录因子,具有十分广泛的作用,直接或间接参与植物生长、发育等生理过程,并且在植物应答非生物胁迫和生物胁迫中扮演着重要角色。本研究通
本文介绍了一种高抑制能力梳状滤波器的设计。给出一种用于谐波雷达中的滤波器结构和电气性能,其指标满足谐波雷达的整机要求。
本文是数据产品磁芯存貯器公司发明和承认的专利。此专利为生产存貯磁芯的带工艺,包括整个带的制造以及制成环形磁芯的冲孔方法。此工艺基本上包括把铁氧体粉末制成柔韧的带,
期刊
目的观察奥美拉唑联合生长抑素治疗老年重症急性胰腺炎(SAP)患者的效果。方法选择2014年1月至2015年12月浙江萧山医院消化内科收治的老年SAP急性反应期患者60例为观察对象,按照
随着低剂量CT检查的广泛应用,可早期检出肺外周病变。以往通常采用普通支气管镜进行盲检、经X线引导下进行支气管肺活检(TBLB)、经超声或CT引导下肺穿刺活检等方法来诊断疾病的
目的观察自拟补肾活血方辅助治疗早期糖尿病肾病的效果。方法选取2014年10月至2016年10月该院内科诊治的早期糖尿病肾病患者120例,按随机数字表法分为对照组与观察组各60例,