基于多任务学习的知识库问答方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:whisperings
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习技术的发展,知识图谱问答任务取得较大进展,单跳问题的问答较为简单,因为它只涉及一个三元组,但当问题变得复杂,涉及多个实体的比较和推理时,机器尚不能很好地解答。如何让机器像人类一样学会推理,从而处理复杂问题,是当前的一个研究热点和难点。基于上述问题,该论文使用基于推理路径生成和阅读理解方法以及多任务学习方法来实现知识库问答,研究内容分为以下三个方面:1.基于推理路径生成的知识库问答方法研究。将知识库问答当作推理路径生成来替代传统的流水线式问答,推理路径指的是一种在知识库中的查询推理路径,本文首先使用传统神经网络方法将答案转化到与问题向量同一个维度的向量进行问答,之后使用预训练的Transformer模型进行研究。通过将问题和推理路径进行拼接输入到预训练模型进行训练,省去了传统流水线式知识库问答的繁琐环节。2.基于阅读理解的知识库问答方法研究。对于推理路径生成方法,我们发现有一些生成的推理路径其中有少量错误,导致无法从知识库中找到答案,基于上述问题,我们在数据集上进行了重新构造,将原本的问答数据格式构造为阅读理解格式,即用生成的推理路径和数据集中的候选选项信息,重新构造出一个阅读理解问题的上下文,并且对数据集不同的重新构造方式对结果影响的对比也进行实验。3.基于多任务学习的知识库问答方法研究。根据以上两个任务我们得到了两种类型的模型:基于推理路径的生成模型以及基于阅读理解的问答模型,本文对两种模型进行了多任务学习,利用相关任务中包含的有用信息来提高所有任务的泛化性能,分别实验了三种不同多任务学习方式,在任务之间实现更好的知识共享,提升了模型的泛化效果和表示能力,降低每个任务过度拟合的风险。
其他文献
本研究是基于河北省保定市境内的雄安新区白洋淀基线调查项目,对白洋淀不同土地类型的沉积物重金属的现状调查,开展白洋淀典型沉积物重金属的质量基准和生态阈值研究,深入研究沉积物中重金属对水域环境和水生生物的潜在风险和毒性影响,以期为白洋淀底栖生态环境的治理与修复提供科学的基础理论依据。本研究选取白洋淀的不同类型的沉积物为研究对象,评估白洋淀沉积物中不同重金属的含量及形态分布特征,运用相平衡分配法推导白洋
学位
随着无人平台技术的发展,面对复杂环境时单一的无人设备已经难以完成任务,集成多无人设备所构成的集群系统因其具备诸多优点成为如今无人系统的研究热点。未来战场急需无人集群的高效协作,本文将针对战略点进行保卫的攻防场景抽象为无人集群协同搜索和无人集群博弈对抗两个问题。本文的研究重点是如何设计无人集群的协同策略来完成上述两个问题。在无人集群协同搜索中,将问题建模为区域覆盖问题,提出基于分区的协同搜索算法和基
学位
辽宁省属于我国重度缺水的省份,葠窝水库作为辽宁省辽阳市的重要自然保护区,水体污染和水生态安全已经成为区域重要的环境问题和社会问题。在葠窝水库水质和水环境持续改善基础上,系统开展葠窝水库鱼类重金属污染状况及其健康风险评价,可为进一步提升其水环境功能,开发渔业养殖,维护水体健康发展和实现水资源的可持续利用提供科学依据,为有关部门科学决策提供参考。基于文献计量学方法梳理国内外及葠窝水库鱼类资源和鱼类受重
学位
网络这一结构应用广泛,随着计算机技术的发展,网络相关的分析任务也在科研与生活领域中越来越重要。比如社交网络分析,模式匹配等工作。网络节点嵌入能够将网络信息通过低维向量空间进行表示,便于我们通过现代机器学习方法对网络进行分析。网络对齐则能够将多个相关网络的数据关联起来,通过融合不同网络的信息,从而挖掘更多的有效信息。由于现有的网络分析相关研究中不能够充分利用网络中节点的局部结构信息,本文通过使用Ri
学位
高校学生干部作为高校思想政治教育工作队伍的重要组成部分,部分学生干部在理想信念、道德素养等方面的偏差给新的时期落实好高校立德树人根本任务带来威胁。加强学生干部队伍建设是新形势下思想政治教育内涵式发展的必然路径。运用层次分析法建立了4个一级指标、16个二级指标的中医药院校学生干部胜任力评价模型,并使用模糊判断矩阵进行实证分析提出了新的时期加强中医药院校学生干部队伍建设的建议。
期刊
大数据技术已经有了较长时间的发展,从提供决策依据到云计算、人工智能的提出,更是到现在我国提出大力打造数字经济,大数据始终以一个较快速度更新迭代式发展。工业生产是一个典型的大数据产生场景,工业生产过程往往使用多个传感器以时间标记来收集数据,构成了时间序列数据的多维特性,数据的多个维度一般会存在相关性。另外,由于工业生产场景复杂,收集到的数据不都是正确的,因此多维时间序列数据中包含大量的劣质数据,价值
学位
知识图谱是一种将知识进行结构化存储的技术,被广泛应用于自然语言处理、推荐系统、信息检索等多个领域。本文研究的实体链接,任务目标是找到文本中已识别的指称与目标知识图谱中实体之间语义一致的映射,从而消除自然语言表达的多样性和歧义性,是知识图谱构建和应用过程中的关键环节。实体链接通常分为候选实体召回和候选实体排序两个阶段。候选实体召回常用的方法依赖于实体别名列表,而别名列表的构建和优化需要耗费大量的人力
学位
人类生产活动导致的石油污染对环境和生态系统构成严重威胁。在石油烃的主要成分中,芳香烃中的多环芳烃(PAHs)危害最大。微生物在降解多环芳香烃污染方面具有高效、环境友好和成本低等优势,目前虽然已经有很多可以降解PAHs的菌株被筛选分离出来,但是关于菌株对PAHs的降解机制仍有待探索。本研究首先选择了一株分离自石油源的坚强芽孢杆菌Bacillus firmus,首先进行菌株生长动力学分析,测定其对萘、
学位
为了加强交通运输的安全性,X光安检扫描仪作为一种能快速高效检查的设备快速发展,为人们的出行提供了安全的保障。但是X光安检扫描仪需要配置相应人数的安检工作人员来进行操作和引导,这大大增加了交通运输系统的人力和物力成本。安检工作人员首先需要进行严格和系统的培训,对于不同情况的X光扫描图有明确的判断。但是目前的暴恐物品识别算法主要存在以下两个问题:(1)在越深的卷积神经网络中,图像的特征图分辨率会越来越
学位
传统的方式治疗癌症有许多弊端,因此设计安全高效的靶向药物将给癌症患者带来新的希望。药物伊马替尼作为中国治疗慢性粒细胞白血病(CML)最早上市的小分子靶向药物,它开启了一个治疗此类疾病的新篇章。第一代药物伊马替尼对于大部分的CML患者有一定的效果,第二代、第三代药物虽然治疗效果优于伊马替尼,但是副作用较大。因此,设计更安全更高效治疗CML的药物是很有必要的。以药物伊马替尼为先导化合物,对其结构改造期
学位