基于查询图生成的知识库问答研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:UsherChen2431
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人们对获取信息的便捷性要求随着信息的急剧增长而提高。不同于传统搜索引擎需要用户提炼关键字并从返回结果中筛选信息,知识库问答系统能够根据用户的自然语言输入返回精确简洁的答案,节省了用户的时间和精力。知识库问答包含答案监督和查询监督两种任务。前者不依赖于查询标注,能够加速应用的实现,其中结合一些规则进行查询图生成的方法能够在弱监督前提下处理复杂问题。后者在查询标注的监督下训练问题到查询的自动转换模型,其中自动生成查询图的方法能够在不依赖于人工规则的前提下取得较好的结果并具有较好的可移植性。因此,基于查询图生成的知识库问答研究具有重要的意义。现有答案监督的查询图生成方法在排序阶段忽略了查询图的结构信息。查询监督的查询图生成方法在编码阶段忽略了输入话语的句法信息。本文针对上述问题展开了一系列工作,主要内容包括:针对答案监督的查询图生成方法中结构信息被排序模型忽略的问题,本文构建了基于特征排列的查询图生成方法。该方法引入Tree-LSTM编码查询图的结构特征,与预训练模型BERT提取的相似度特征以及其它手工特征一起进行查询图排序。基于特征排列的查询图生成方法,在两个常用的英文公开问答数据集的平均F1值上,比最好的对比方法分别高出0.8%和0.1%,其中结构编码贡献0.3%和0.2%。实验结果验证了结构编码和整个模型的有效性。针对查询监督的查询图生成方法中输入话语的句法信息被编码器忽略的问题,本文设计了基于编码器-解码器框架的查询图自动生成模型,模型采用Bi-LSTM编码词嵌入和词性标注信息,使用图神经网络编码依存树信息和依存标签信息。在两个公开英文数据集上的实验表明,融合了句法信息的查询图生成模型具有更好的性能。平均F1值比最好的对比模型分别高出3.2%和3.1%,其中所有的句法信息贡献1.8%和2.9%。最后,本文将提出的融合句法信息的查询图生成模型与通用的实体识别和实体链接方法一起应用于音乐领域知识库问答系统中。通过展示问答系统的功能,验证了查询图生成的方法在音乐领域知识库问答中的实用性。
其他文献
转速是评价电机系统运行状态和控制性能的重要指标之一,因此转速测试对于降低电机设计和维修过程中的成本,监控电机系统安全运行以避免工业事故的发生,保障人身安全等具有重要的意义。在电机系统的转速测试中,当速度传感器不便安装时可以对电机的电流或振动信号进行频谱分析获得转速信息,但是这种方法在转速突变的工况下跟踪性能较差。因此研究一种简单通用、快速准确的转速测试方法具有一定的工程应用价值。本文提出了三种转速
钢管混凝土叠合柱是一种新型钢筋混凝土结构构件,它是由钢管混凝土外包钢筋混凝土而成的柱,由于这种结构柱的承载能力高、抗震性能优越、施工相对简单,防火、防腐蚀、防锈蚀能力好,现在已经普遍用于高层建筑结构中。目前实际工程中梁柱节点连接方式有三种,但三种方法均存在梁柱节点构造复杂、施工效率低等缺点,限制了钢管混凝土叠合柱结构的推广。本文为了实现混凝土梁纵向钢筋的有效锚固且保证良好的静力性能,提出了一种新型
永磁同步电机(PMSM)因其体积小,效率高,功率密度大的特点,被广泛应用于高端制造业。由于传统矢量控制难以满足较高性能控制需求,本文采用改进模型预测转矩控制结合空间矢量调制(MPTC-SVM)提升控制性能;为了进一步扩大PMSM的应用范围,本文还用模型预测控制改进了基于模型参考自适应系统的无位置传感器控制(MP-MRAS),并通过仿真与实验验证了两种改进措施的有效性。本文主要工作内容:(1)从PM
如今,随着移动互联网技术的发展和普及,互联网数据流量高速增长,视频流量更是占据了主要部分,同时终端设备的高性能和低延时使得人们对网络上视频清晰度的要求也越来越高。加上云平台和云计算的发展,有更多人通过网络传输高清视频或上传云端保存高清视频,这使得视频的安全性成为重要关注点。利用视频加密和隐藏的方法,人们可以在上传视频时将视频内容扰乱,同时嵌入访问控制、完整性校验甚至隐私保护等信息。高效视频编码(H
中国消费市场的快速增长为中国新型的可穿戴产品创造了巨大的需求,由于是贴身产品,可穿戴类型的产品对于产品的舒适性要求相比普通的工业产品要高得多。特别是一些头戴产品如自行车头盔、VR眼镜、护目镜等典型产品,需要与头型有良好的贴合性能,才能具有佩戴舒适性和防护安全性,但由于人体头部形态的复杂性,头戴产品内部形态设计必须参考头型曲面,需要相关的头型数据和分析工具来辅助设计。目前头戴产品设计师在设计过程中普
伴随着互联网的发展,各类应用系统不断出现,每个应用系统都为用户提供了各种不同的功能,用户新提出的需求中有很大部分是可以借助应用系统现有功能之间的集成来实现的。目前功能集成的实现通常是由开发者通过传统编码来完成,实现过程中开发者需要完成大量繁琐的操作,且各开发者的编程习惯各不相同导致代码可读性得不到保证。为解决以上问题,本文提出了一种面向功能集成场景的编程语言——集成帮语,开发者可使用集成帮语提供的
灰霉菌(Botrytis cinerea)具有宿主广泛、侵染方式多样与易产生抗性等特点,是难于防治的主要病原真菌之一,近年来对多种温室、大棚栽培蔬果危害日益严重。白藜芦醇等植物源二苯乙烯类化合物对灰霉菌等植物病原菌具有良好的抗菌活性,常作为先导化合物用于新药研发。杂环异噁唑具有独特的结构特征与理化性质并表现出广谱高效的生物效应。基于此,本文采用以分子杂化方法将3-取代苯基异噁唑活性亚结构引入二苯乙
面向开放领域的对话生成技术是构建智能对话系统中重要的基础技术。该技术旨在使用文本生成的方法,基于对话上下文生成不限领域的回复。目前该技术已广泛应用在智能助手、聊天机器人等应用中,具有很高的研究价值。目前主流的面向开放领域的对话生成模型,都是基于Seq2Seq结构设计的。这些模型在解码阶段使用单一解码器一次性生成对话回复,没有对回复中的实词和虚词进行区别对待。而由于虚词在对话数据中出现的频率要远高于