基于知识图谱的可解释多跳问答方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:carinalove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能领域逐步从感知智能向认知智能时代迈进,作为认知智能基础支撑的知识图谱在近年来受到学术界以及产业界的广泛关注与研究。尽管知识图谱有关技术实现了跨越式发展,但由于知识图谱中存在海量的事实三元组,同时三元组条目间的拓扑结构十分复杂,因此,如何准确且高效地从海量知识中检索出用户所需的信息仍然充满挑战。为链接终端用户与智能信息系统以实现从知识图谱中检索信息,知识图谱问答方法被出,其目的是理解用户所出的自然语言问题,并从知识图谱中精确检索出相应实体或属性值作为答案返回给用户。本文重点关注多跳知识图谱问答任务,多跳问题是指需要由不少于两个首尾相连的三元组所构成的路径才能回答的问题。现有工作在处理该任务时面临如下四点挑战。(1)模型可解释性较弱,即由于神经网络的黑箱性质,导致模型无法给出中间推理过程。(2)依赖强监督信号,即在训练过程中需要已知中间推理步骤。(3)假推理路径,即模型沿着错误的推理路径,偶然地到达了正确的答案节点。(4)知识图谱稀疏性,即虽然知识图谱规模庞大,但仍遭遇严重的不完整性与不充分性,直接将现有方法应用到稀疏知识图谱场景下会造成性能显著下降。本文工作围绕上述四点问题展开研究,特别地,增强模型可解释性将贯穿于本文出的所有方法中。为此,本文制定如下研究工作:1.基于强化学习的弱监督多跳知识图谱问答方法。此研究工作关注模型可解释性弱、强监督信号问题。出于标注数据的成本考虑,多跳知识图谱问答数据集通常仅标记出最终答案实体,而未给出中间推理过程。为使模型具备弱监督训练的能力,并增加必要的可解释性,此研究工作遵循强化学习技术路线,将知识图谱问答视作序列决策过程,并设计基于策略的强化学习智能体循序地扩展推理路径。然而,弱监督训练将导致强化学习方法面临两点主要挑战:(i)无目的探索。(ii)延迟与稀疏奖励。为解决上述挑战,此研究工作将潜在目标实体的向量表示作为预知信息注入到强化学习框架的环境状态中,以避免智能体无目的探索。此外,受到奖励塑形机制的启发,此研究工作还将零一奖励替换成软奖励,即为智能体分配额外奖励,使奖励信号更为稠密。实验结果表明,该项研究工作即便是以弱监督方式进行训练,但仍然能达到优异的预测性能。2.基于对抗强化学习的多跳知识图谱问答方法。此研究工作关注假推理路径问题。假路径尽管能到达正确答案节点上,但错误的推理路径违背了问题的真实意图。造成假路径问题的原因在于:(i)由于知识图谱规模巨大,假路径的数目要远多于正确路径。(ii)奖励函数仅考虑智能体是否最终到达正确答案实体,而不关注中间推理路径是否正确。为解决假路径问题,此研究工作受到对抗学习的启发,并设计一个路径鉴别器和一个答案生成器。路径鉴别器用于判别推理路径是否正确,其输出的反馈信号被用于指导答案生成器沿正确路径推断答案实体。与此同时,答案生成器不断为路径鉴别器供高质量负样本,路径鉴别器借助这些愈加难以判断的负例,不断升自身判别能力。两模块以对抗学习方式进行训练,二者不断促进相互升。实验结果表明,该项研究工作在答案预测Hits@1以及推理路径准确率上要显著优于传统强化学习方法。3.基于多智能体协作学习的稀疏知识图谱问答方法。此研究工作关注知识图谱稀疏性问题。为缓解该问题,现有文本增强方法以及隐推理方法被出。尽管上述两类方法取得了有竞争力的性能表现,但存在可解释性较差或依赖主题实体到答案实体间最短路径的问题。为此,该项研究工作期望从外部语料中抽取文本形式三元组以补充稀疏知识图谱,从而增加图结构稠密程度。为过滤掉文本语料中大量噪音且不相关的信息,此研究工作设计一个辅助智能体(即证据抽取器)用以在每一时刻筛选出高置信度的文本形式动作,并动态地补充原始知识图谱动作空间。而主智能体(即路径生成器)为联合动作空间中的每个候选动作计算概率,并执行最合适的动作以扩展推理路径。此外,为增加智能体获得正向奖励的概率,该研究设计了基于束搜索的动作选择机制用于在训练阶段维护多条推理路径,并应用自适应采样策略增加包含文本形式动作的推理路径被执行的优先级。通过与外部环境进行交互,证据抽取器与路径生成器协作执行最优动作,并最大化各自的期望奖励。实验结果表明,利用辅助文本语料能有效缓解知识图谱稀疏性造成的影响,并且该项研究工作在不同知识图谱稀疏程度下均实现了良好的性能。
其他文献
由于复杂的自然环境和工作条件,离岸的海上风机桶型基础不仅处于竖向、水平和力矩等多种荷载的复合加载条件,而且由于复杂的地层条件,海上风机桶型基础往往不会处于单一的土层之中。近些年发展起来的破坏包络面方法克服了传统理论中的诸多不足,能显式地考虑荷载倾斜,荷载偏心,基础形状与埋深,以及地基强度不均匀程度等因素对海上风机桶型基础承载力的影响。破坏包络面理论在沿海的海上风机桶型基础的设计中已获得了广泛的应用
学位
植物为了抵御植食性昆虫的取食,长期进化过程中形成了多种防御机制。为了应对植物这种复杂多变的防御机制,昆虫进化出了一系列反防御策略和代谢适应机制。苦杏仁苷(Amygdalin),普遍存在于梨小食心虫Grapholita molesta寄主范围内的一种植物次生代谢物,是一种天然的植物毒素,其水解产物氢氰酸是一种有毒物质,可抑制呼吸作用。课题组前期研究发现梨小食心虫幼虫对低浓度苦杏仁苷(≤20 mg/g
学位
中国梨木虱Psylla chinensis Yang et Li是我国梨产区主要的害虫,危害大,防治难。对梨木虱的生物防治为当前重点研究方向。本论文对中国梨木虱的一种优势寄生性天敌梨木虱跳小蜂Trechnites insidiosus(Crawford)的形态特征、部分寄生特性、发生动态、对梨木虱的自然控制效果进行研究,对梨木虱跳小蜂生物防治潜力有一个初步的评价。1.梨木虱跳小蜂形态特征梨木虱跳小
学位
地铁交通网的快速发展极大地缓解了城市客运需求,但与此同时,地铁运行引起的环境振动响应也越来越引起人们的关注。在地铁线路规划设计中,曲线线路在绕避地形、绕避敏感建筑物和适应空间布局等方面有着不容忽视的作用;地铁在曲线段运行引起的环境振动较直线段更为复杂,并且曲线段是环境振动病害的多发敏感区域。因此,本文基于地铁曲线段现场实测,采用数值模拟的方法研究分析了地铁曲线段运行引起的振动传播规律及其对邻近建筑
学位
随着人工智能技术的不断发展,越来越多的自然语言处理技术应用到医疗行业。如何从海量医疗数据中提炼信息,并根据用户的问题给出针对性较强的回答,是推进医疗智能化的关键问题。文章研究利用BiLstm+CRF模型处理医疗领域问答相关数据,基于图数据库Neo4j构建一个医疗知识图谱,并在此基础上构建一个问答系统,实现医疗知识的自动问答服务。实验结果表明,该系统可以为用户提出的问题查找匹配准确答案并返回给用户。
期刊
在核心素养语境下,“语文大单元教学”突破原有“教材单元”的内涵,以“大概念”为核心,通过创设任务情境,构建起新的结构化教学,是一种教学新模式,也是一种“单元整体教学思想”。通过提炼大概念、精准学情分析、研制教学目标、重组教学内容、重构教学过程、设计教学评价等环节,力求创新基于核心素养的小学语文大单元教学设计,实现让学生在真实的语言实践活动中学习和运用语言,用语文做事,进而全面提升学生的语文学科素养
期刊
作为和人们生活联系最紧密的学科之一,数学是一项值得探究和学习的重点学科。小学数学教材中的内容通常以单元为结构表现形式。因此,数学课程中的学习单元往往是一个联系密切且具有共同主题的整体性教学。按照小学生成长的认知规律与特点,教师应该由浅入深、由易到难地进行课程教学或内容编排。对此,文章以小学数学大单元整体化教学为基础展开探究,意在利用单元整合,引导广大教师在整合单元知识点的过程中,帮助学生不断提升数
期刊
项目化学习是进行大单元教学的方式之一。学生在进行项目化学习时要站在整体角度,完成相关任务,掌握知识,建构知识体系,增强学习能力,发展核心素养。教师可以沿袭建构单元—确定目标—践行方案的流程,进行基于项目化学习的初中数学大单元教学。文章以图形的变换为例,以教学流程为重点,阐述相关教学策略。
期刊
由于化学农药大量使用,小菜蛾Plutella xylostella已成为抗药性较强的害虫之一,寻找高效绿色的综合治理手段迫在眉睫。利用寄主植物产生的一些次生代谢物质能够对植食性昆虫表现出引诱、刺激取食等作用,而非寄主植物产生的次生物质对昆虫表现出驱避、拒食及生长抑制等作用。本论文研究了植物次生代谢物质对小菜蛾嗅觉行为及取食行为反应影响,筛选出了对小菜蛾幼虫有较强引诱、和驱避作用的次生代谢物。研究结
学位
三孔线虫是一类土壤中的捕食性线虫,可作为植物寄生线虫的生防资源,有些种类可作为土壤环境的指示生物。Andrássy(2007)将三孔属Tripyla Bastian,1865,微三孔属Tripylella Brzeski&Winiszewska-?lipińska,1993,三裂口属Trischistoma Cobb,1913,小三孔属Tripylina Brzeski,1963和无毛三孔属Tob
学位