基于知识图谱的中文自动问答技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:ceylong2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着自然语言处理技术的飞速发展,问答系统成为当前主流搜索引擎的一个不可或缺的功能。基于知识库的问答系统(Question Answering over Knowledge Base,KBQA)以知识图谱为知识源,通过将用户的自然语言问题转换为SPARQL结构化查询语言查询知识图谱并向用户返回结果。但是,目前中文知识图谱的资源相对匮乏,主流中文知识图谱存在数据类型未标注、三元组的客体未进行实体链接和分类体系不完整等问题,因而难以支持复杂的SPARQL查询,为中文KBQA的应用带来了困难。为改善这种状况,本文从以下几个方面开展了研究:1、对现有的中文知识图谱资源进行分析,重点分析了它们在支持复杂SPARQL查询方面存在的不足。然后基于分析结果,提出了一种通过中文知识图谱的融合来使知识图谱支持复杂SPARQL查询的方法。最后对融合后的知识图谱进行了评估。实验结果表明,融合后的知识图谱可以支持复杂SPARQL查询,有效改善了当前主流中文知识图谱中存在的问题。2、针对KBQA系统中事实型问题问答的一类基础问题——单实体关系问题展开研究,提出基于条件随机场(Conditional Random Fields,CRF)的中心实体识别方法和词向量与字符串相似度计算相结合谓词映射方法。实验结果表明,单实体关系问题的中心实体识别准确率和F1分数分别达到了89.14%和88.81%。问题谓词映射的准确率和MRR分别达到了93.41%和95.97%。3、本文基于融合得到的知识图谱开发了能够回答涉及单个实体关系问题的中文KBQA原型系统。在NLPCC 2016的KBQA数据集上的抽样测试结果表明,本文构造的中文KBQA原型系统整体正确率84.10%,MRR达到了86.29%。通过中心实体识别和问句谓词映射这两个重要的步骤,本文构建的KBQA原型系统能够以较高准确率回答中文的单实体关系问题。但是由于相关数据集的匮乏,目前系统不能回答复杂的事实型问题,这类问题的分析是将是下一步的研究工作。
其他文献
以过硫酸钾和硫代硫酸钠为氧化还原引发剂,在氮气保护下,研究了水不溶性半纤维素与丙烯酰胺的接枝共聚反应。考察了引发剂浓度、单体浓度和反应时间等因素对接枝率及接枝效率的
昆明方言有一个广泛使用的“着”字,其意义和用法较之北京话来说更为复杂多样。本文将“着”字分为七种不同的用法分别讨论,侧重点放在与北京话不同的方面。为了叙述方便,将
蔬菜产业是河北省农业主导产业,居河北省种植业首位。近年来,河北省蔬菜产业面临着竞争力不足等各种发展问题,基于集成创新原理来构建河北省蔬菜产业发展模式,通过模式探讨,
阿希尔—克劳德·德彪西是近代“印象主义”音乐的鼻祖,他的音乐作品追求飘忽不定、朦朦胧胧的氛围,和声色彩斑斓,结构精致细腻,织体变化多样,层次丰富清晰,配器新奇特别,十分富有创造力和想象力,他独树一帜的创作手法以及音乐思维、充满创造性的音乐语言以及梦幻般的音响效果给予了人们无尽的遐想空间,在音乐历史的长河中留下了浓墨重彩的一笔。德彪西一生的音乐创作涵盖了音乐体裁的众多领域,如室内乐、管弦乐、钢琴音乐
利用压电材料独特的机/电转换特性,可以实现对不同应力/应变等参数的监测,同时也能将环境中的机械能转换成电能并储存实现能量收集。因此,基于压电材料的传感器及能量收集技
数字多媒体广播(Digital Multimedia Broadcasting,DMB)以其传输内容的多样性、较好的抗干扰性和频谱利用率高等特点,正逐渐被人们重视。DMB广播可以同时播放声音、视频、图
本文主要研究分析了潜射导弹垂直出水过程中载荷特性和出水姿态的变化。导弹出水运动的力学环境变化非常显著,当导弹处于全湿状态时,流体动力对导弹的影响较为显著;当导弹临
“南、北侧巷道间距均为2.5米,与双方签订的调解协议要求一致。”2013年12月5日上午,郑州市惠济区国土资源局地籍科、信访科、大河路国土资源所和惠济桥村国土资源协管员共同对
佩内洛普·莱夫利是一位备受好评的英国女作家,在文学界享有盛名。她凭借《月亮虎》于1987年获得布克奖。在其儿童和成人文学作品中,佩内洛普·莱夫利展示出了对历史和记忆、