基于知识图谱的问答系统的研究

来源 :电子科技大学 | 被引量 : 3次 | 上传用户:ahclgc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的发展使人们获取信息的渠道更丰富,然而获取有效信息的效率也变得更低了。为了解决此问题,基于知识图谱的问答系统(KBQA)成为了研究的热点之一,相较于传统的搜索引擎,它能够实时地给用户反馈准确且简洁的答案。构建基于知识图谱的问答系统共需要四步:命名实体识别、实体链接、属性选择和得出答案,其中,命名实体识别和属性选择是研究KBQA的关键技术。本文在研究KBQA的相关技术后,首先在命名实体识别模块进行了大量对比实验,选择了性能良好的实体识别模型,然后在属性选择模块提出了一个全新的属性选择模型MAF_CNN,并在模型中提出了一个矩阵融合算法,最后,本文将四大步骤连接起来,实现了一个完整的问答系统。本文的具体工作如下:(1)命名实体识别是实现问答系统不可或缺的一部分,由于实体识别模型在中文语料上的实验结果尚不够充分,对此,本文在同一数据集上对当前常见的模型进行了多组对比实验,最终选择了基于BERT-Bi LSTM-CRF的命名实体识别模型。(2)在属性选择模块中,本文提出了一个基于卷积神经网络的属性选择模型MAF_CNN。为了解决单一中文分词工具无法充分提取输入信息的问题,该模型采用了多粒度的输入方式,同时在嵌入层和卷积层之间,加入了多头自注意力机制,用于捕获句子的长距离上下文信息,然后将问句和候选属性通过卷积层和k-max池化层提取的特征向量进行相似度匹配融合。(3)为了解决MAF_CNN模型中相似度特征提取不足的问题,本文提出了一个矩阵融合算法,能够更有效地捕获文本序列的相似特征,并在交互融合矩阵后,通过卷积层和最大池化层提取相似度更深层次的特征。(4)本文分别实现了KBQA的四个模块,并将它们连接起来,实现了一个基于中文知识图谱的问答系统,最后对系统进行了功能测试。本文实现的问答系统在NLPCC2016大赛问答数据集上进行了测试,并与大赛的前五名结果进行了对比。实验结果表明,本文研究的问答系统的平均F1值超过了大赛第一名,验证了本文研究模型的有效性。
其他文献
神经机器翻译是将一种语言的文本翻译成另一种语言的同义文本的任务,是自然语言处理的一个十分热门研究方向。如今,神经机器翻译在越来越国际化的社会起着至关重要的作用,其大都是基于序列到序列框架构建的,该框架包括一个编码器和一个解码器。编码器负责将输入的源序列映射到一个语义空间;解码器根据编码器的结果迭代地预测出目标序列。序列到序列模型的编码器的训练过程和测试过程是相同的,都是将源序列编码到一语义空间,但
学位
互联网的开放性使得用户可以在网上对参与过的活动发表评价,同时也为其他用户提供决策参考。爆炸式增长的信息量使得人工分析变得困难,对这些来自用户的评论进行自动化情感分析,具有较高的理论分析和实际应用价值。方面级情感分析是一种细粒度情感分析任务,基本的任务目的是寻找评价的对象以及对应的情感极性,也因此更具有挑战性。方面级情感分析有许多子任务,其中最基本的是方面词抽取以及方面情感分类。本文从三个方面讨论了
学位
个人所得税是一个极具增长潜力的税种,随着个人所得税收入的扩大、地位的提高,其对调整收入分配和增加财政收入的影响巨大。自2019年修订新《个人所得税法》后我国不仅在法律上改革了个人所得税制度,也逐步将着力点落在了提升个人所得税的征管水平上,但目前个人所得税征收和管理的改革一直落后于税收制度的改革,导致目前的个人所得税制仍然难以全面落实。面对电子商务和信息技术的迅速发展,个人收入来源的差异化和隐蔽性逐
学位
地震反演是将地震资料转化为地下介质岩性和含油气信息的重要技术手段。由于地震数据具有带限特征和噪声干扰影响,导致地震反演存在低分辨率及多解性问题。主要体现在垂向地震道高频和低频部分缺失和横向多道地震数据的不连续性。解决反演分辨率问题最直接的方法就是通过正则化手段加入高频和低频信息进行约束反演,比如通过假设高频信息满足特定数学假设实现对地震数据的频带拓宽。有研究表明,常规特定数学假设不满足实际地层条件
学位
相比于传统的成像方式,基于光场的成像方式在记录场景中光辐射的位置信息的同时,也记录了光辐射的方向信息。光场图像“单曝光多视角,先拍摄后聚焦”特点为被动式深度估计方法打开了新的思路,具有重要的研究意义。然而如何在充分利用四维光场信息的同时,解决光场图像基线窄、遮挡区域深度估计误差大等问题是该研究的重要课题。本文研究的主要工作内容包括:1)提出基于稀疏AD-Census及十字多视点的匹配代价计算方式。
学位
随着城镇化与公共基础设施建设的不断推进,施工项目的数量与日俱增,而由于建筑工人安全意识不强,在施工现场每年都会发生大量因安全违规导致的安全事故。定期开展安全培训与安排安全巡视员进行现场巡视等手段对于降低工地安全事故率只能起一时之效,无法时刻对施工现场的安全违规进行监督。近年来,以工地上广泛安装的监控摄像头作为视觉终端,利用计算机视觉技术对施工现场的工人违规行为进行安全预警是一个新的研究热点,并且对
学位
随着城市生活水平的提高,公民对公共安全的关注度越来越高。但是,近些年因为大规模人群聚集活动导致的安全事故时有发生。因此,利用智能监控系统对人群密集场景下的人群数量、密集程度以及潜在的安全事故风险进行预测,为人工管理提供参考信息是很有意义的。近年来,基于人群密度估计的人数统计领域不断发展,现有的人数统计方法已经达到了较高的准确率,但是这些算法需要具有强大计算资源的硬件设备进行支持,且算法的推理时间长
学位
如今,在工业领域中,智能制造是推进工业制造领域快速发展的原动力,数据是联系新兴技术与智能制造的纽带。然而,目前工业产品从设计、制造、加工、生产以及销售产生的庞大数据多以关系型数据库进行存储,使用该种方式存储,在增加数据冗余性的同时使得数据的存储聚合度降低,导致知识的潜在价值被埋没。为发挥工业数据价值,发掘工业数据的潜力,本文将知识图谱技术应用于工业设计行业,利用图结构的方式,将工业设计数据进行重组
学位
在地底资源开发和地质勘探中,电磁波测井是一种重要的获取地层信息的手段;其中电磁波测井中有两种重要的探测方式,一种是在单口井中的无载波脉冲雷达体制,一种在两口井或者多口井之间的井间电磁体制,本文将针对两种系统的发射源的设计与实现进行讨论。在无载波脉冲雷达体制中使用的发射源是双极性高斯脉冲,这种脉冲具有瞬时功率高、大带宽、幅度高等特点;在本文的设计中主要是通过雪崩管来产生单极性的高斯脉冲,并通过Mar
学位
微显示技术是近几十年来随着电子信息化进程加快而兴起的显示技术,它凭借微型化、轻重量和高分辨率等独到之处,已成熟运用在军工技术、医疗卫生、交通通讯等领域。其中,采用成熟的CMOS集成电路工艺制作的LED微显示器件更具特色,是一种集成了微电子器件、光电系统和集成电路等的综合性器件,具有极为广阔的发展前景。本文立足于与标准CMOS技术完全兼容的硅基光源,基于使用该光源的光电微显示像素阵列而设计了一套完整
学位