基于图神经网络的结构化知识库自动问答技术研究

来源 :苏州科技大学 | 被引量 : 0次 | 上传用户:taodengjiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结构化知识库自动问答任务面向自然语言问题文本与结构化知识库,通过模型学习生成SQL语句获取问答结果,是当前自然语言处理领域的重要课题。针对现有结构化知识库自动问答无法有效解决问题文本中存在的实体模糊、问题文本难以与知识库语义融合、答案生成不自然等问题,本文以中文结构化知识库的自动问答为研究对象,结合单个知识库、单轮问答场景,构建深度学习模型,实现自然答案生成,提升基于结构化知识库的问答效果。本文从以下三个方面开展研究工作:(1)针对问题文本中存在模糊实体的问题,本文提出基于图神经网络和正则表达式的实体去模糊方法。首先基于正则表达式技术,将问题文本中存在的模糊数字实体、模糊百分比实体、模糊年份实体提取并清晰转化;其次基于图注意力网络构建图结构数据,将缺失文本实体进行去模糊操作。在中文NL2SQL数据集中的实验表明,本文模型相较于未去模糊模型综合性能提升1.5%,有效提升文本实体抽取的准确度。(2)针对问题文本难以与知识库实体语义融合的问题,本文提出基于图神经网络的SQL生成模型。首先基于预训练模型获取初始化的问题文本语义表示;其次通过门控图神经网络模型对问题文本与结构化知识库进行关联特征学习与生成,获取基于问答场景下的语义表示;最终基于分类模型生成SQL。在中文NL2SQL数据集中的实验表明,本文模型相较于非图神经网络模型在综合性能提升2.2%,全匹配度达到64.5%;在Wiki SQL数据集中,本文模型全匹配度达到65.8%,有效提升SQL生成性能。(3)针对SQL返回答案单一且片段的问题,本文提出基于图神经网络的自然答案生成模型。首先借鉴槽位填充机制,设置主-谓-宾结构;其次通过图神经网络技术,进行自然答案的填充。在中文NL2SQL数据集中的实验表明,本文模型的全匹配度达到59%,相较于非自然答案生成模型性能提升4%。本文基于图神经网络的结构化知识库自动问答任务面向实际需求,有效解决问题文本不易被问答模型理解、知识库信息难以与问题文本信息进行融合表示、自动问答答案生成不自然的问题。测试结果表明对自动问答任务中SQL语句生成以及自然答案生成任务均有一定的效果提升,为后续基于结构化知识库的自动问答研究提供重要支撑。
其他文献
在第五代移动通信技术中数据流量呈现了爆发式的增长,使得无线通信网络研究迎来了更大的挑战。一方面,合理利用传输网络中的信息在有限的网络资源条件下设计出高频谱效率的传输方案;另一方面,在实际无线通信场景中,由于反馈延迟、量化误差和噪声干扰等造成的信道估计误差是无线通信系统设计难以避免的问题。如何对不完美信道状态信息建模以及在存在信道估计误差情况下设计出具有鲁棒性、高性能、能量消耗可持续的信息传输是无线
学位
如今,大跨度钢结构在国内发展迅猛,由于社会科学技术的不断进步、人们生活水平的提高,人们对结构的外观的造型要求也越来越高。由于管桁架结构受力性能良好、空间的跨越能力强,因此广泛用于体育馆、图书馆、机场等大跨度结构中。但大跨度管桁架结构施工周期长、外形复杂,施工过程中需要考虑结构的受力及变形,因此本文以盐城体育馆管桁架屋盖结构实际工程为研究对象,对其进行施工全过程力学分析及研究,为相似实际项目提供理论
学位
在智慧城市背景下,随着多种分布式发电技术的发展,由各类分布式发电设备构成的微电网层出不穷,促使电能交易向分布式方向发展。在微电网中,具有发电能力的用户均可参与售电,交易多方可按需转换角色,直接进行交易,电能交易以分布式结构为主。然而,传统的电能交易机制由大电网集中控制,交易成员角色固定,呈集中式交易结构。随着交易规模及数量的增多,若将该传统交易机制简单应用至分布式电能交易中,一方面会增加交易系统运
学位
自改革开放以来,我国城市化进程不断推进,逐渐出现工业用地低效、闲置、错配、失衡等问题,而现行政策约束机制、激励机制对政策执行者行为的干预效果不理想,出现地方执政“不敢为”、“不愿为”等现象,原因在于现有研究对绩效形成过程中行为主体的责权边界及其作用机制的关注不足,迫切需要构建适应新时代发展的政策制度。本文基于工业用地绩效与其管理政策效力之间的关联性及作用关系展开研究,以2004年至2016年江苏省
学位
在国家人口出生率逐年下降,老龄化日益严重的背景下,AGV可以很好地解决生产过程中劳动力短缺的问题。经过多年的发展,AGV已经成为建筑行业、工业生产、酒店服务等行业中的重要工具。通过对AGV路径规划算法的研究,有助于降低劳动力成本,提升效率,保障生产过程中人员的安全。路径规划算法是AGV提升性能的关键技术,由于现在生产环境逐渐复杂,对于AGV路径规划算法的研究一直是热点问题。本论文主要对RRT系列算
学位
随着全世界数字化趋势日益剧增,大型复杂数据中心的强化日趋重要,而提高制冷效率是降低数据中心整体能耗的关键性手段。对于传统的空调送风形式,送风距离长,IT设备冷量分配不均,易造成机房内部局部温度过高、能源浪费,需使用新型制冷技术来改善数据中心的气流组织,改善机柜所处热环境。为解决上述问题,对将房间级、行级、机柜级三种不同的空调系统制冷方式进行了介绍和优缺点的对比,并介绍了一种新型行级空调供冷系统,对
学位
现代化的军事作战中,炮弹的射击精度会不同程度地影响作战性能。由于炮弹发射的后坐力作用,炮弹的初速度方向偏离火炮身管轴线方向产生跳角。传统的火炮跳角测量方法会出现精度低、误差大等问题,且并未实际解决不同仰角射击下的跳角测量问题。本文主要研究火炮仰射跳角光学标定方法,主要工作有以下内容:针对传统的火炮跳角测量方法不能解决大角度仰射状态下的跳角测量问题,并且存在误差大、误测和漏测等不足,本文提出一种火炮
学位
蛋白质分子间稳定的互作用促成蛋白质复合体的结构形成,进而决定该蛋白质在人体生命活动中所行使的功能。G蛋白偶联受体(G Protein-Coupled Receptor,GPCR)是当前新药研发中最有针对性的蛋白质家族之一,此类蛋白质主要承担着细胞内和外部环境间的信号传递,是一种十分关键的信号分子受体,它们参与了众多复杂的生理功能活动。这其中GPCR残基间的互作用对其稳定的三级结构形成具有强烈的约束
学位
迟子建是当代文坛具有广泛影响力的作家之一,有着“极地之女”、“北国精灵”的美誉。迟子建始终以独特的姿态存在于人们的视野中,不追随任何一种思潮或流派,一直坚守自己独有的创作理念和审美追求。迟子建的小说紧贴民间大地,她在写作中对民间生命投之以温和的注视,书写东北黑土地上的人间百态。民间伦理作为迟子建作品中的经脉,是其搭建民间世界的材料。因此,本文选择将民间伦理作为一个切口,进入迟子建所建造的东北民间世
学位
为了降低成本,风电机组的单机容量越来越大,对其输出优质电能、稳定状态运行等方面也提出了更高的要求。对于风速和叶片载荷实时、有效的检测和可靠、精确的算法处理是实现对风电系统有效控制的前提与关键。本文针对传统的风速检测仪器无法有效地测量风轮轮毂处风速,现有风速估计方法存在精度差、滞后性等问题,提出了基于激光雷达的风速检测和轮毂处估算方法。首先介绍了激光雷达的远距离风速测量原理和方法,然后为了得到风机轮
学位