论文部分内容阅读
人工智能技术的飞速发展催生了一系列新技术的涌现,自动问答系统是其中的代表成果。与传统的搜索引擎不同,问答系统能用准确简洁的答案回答事实类提问,降低用户使用成本。知识图谱是一种新型的知识存储形式,数据在逻辑上构成了一张巨大的网络。相比于传统的关系型数据库,知识图谱中能够更好地描述实体之间的语义关系,符合人类对客观世界的思维。基于知识图谱的问答系统结合了自动问答系统与知识图谱的优势,受到了越来越多的关注。本文就基于知识图谱的问答系统的关键技术与落地应用进行研究。本文首先对基于知识图谱的问答系统的关键技术包括实体识别、实体链接与关系检测进行了介绍与研究。实体识别与实体链接是问答系统的前置任务,对最终问答效果起关键作用,本文介绍了这两项任务定义、常用方法与评价指标。针对简单问题的回答,本文详细介绍了基于残差连接的关系检测模型,并结合最新的预训练模型技术进行了改进。针对复杂问题的问答,本文提出了基于语义图的语义解析方法。语义图是自然语言问句与SPQARQL逻辑表达式的中间表示形式。通过预定义的动作可以不重不漏地生成所有可能的语义图。语义图的逻辑结构为有向图,针对此特征本文使用门控神经图网络进行语义图的编码,并在此基础上尝试了多任务学习方法来进一步提升模型能力。实验结果显示了我们所提方法的有效性。尽管学术界针对知识图谱问答系统提出了种种方法,然而在实际中却遇到落地困难的问题。造成这种困境的原因主要是由于知识图谱与训练数据的不匹配。针对这个现象,本文提出了基于问题生成的知识图谱问答方法。该方法通过模版将三元组扩展为完成的问句。当用户进行查询时,系统使用全文检索技术与语义匹配模型从生成的问句中检索出与用户查询匹配度最高的问句,并将对应的三元组返回给用户。本文提出的基于问题生成的方法能够以较低的人工成本开发出可用的知识图谱问答系统。在哈尔滨工业大学百年校庆之际,本文构建了以哈尔滨工业大学校园信息为主题的知识图谱,并针对此图谱进行了数据标注。该图谱是国内外第一份以高校信息为主题的知识图谱。在此图谱上本文对比分析了基于语义图的问答方法与基于问句生成的问答方法两种方案的效果,并开发了可用的问答系统。