联合逻辑形式解析和答案生成的知识图谱问答方法及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:chaizw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱问答(KBQA)指用结构化的知识图谱中的实体和关系等信息回答自然语言问题。主流的解决方案可以分为两类:基于语义解析的方法将问题解析为知识图谱接口可执行的逻辑形式以返回答案;基于信息检索的方法根据问题索引知识图谱中的相关子图,返回子图中顺位较高的相关实体直接作为问题答案。从目前研究来看,这两种方法各有优缺点。基于语义解析的方法存在从自然语言问题到可执行的逻辑形式的鸿沟,传统的解决方案大多基于实体识别、实体链接、依存解析等自然语言处理(NLP)中的子任务,转换过程中存在误差累积;基于信息检索的方法一般可以分为索引和排序两步,在索引阶段同样需要借助实体识别等子任务,在排序阶段直接生成问题的答案又缺乏可解释性,往往难以处理复杂的问题。基于上述问题,本文提出了一种联合逻辑形式解析和答案生成的知识图谱问答方法,并基于该方法,结合中医领域知识实现了一个中医问答系统。具体来说,本文研究与实现过程包含以下贡献点:1.本文提出了一种联合逻辑形式解析和答案生成的知识图谱问答方法,基于生成式模型T5构造统一的生成式模型框架,同时生成自然语言问题对应的逻辑形式和答案,构造代价函数联合二者得到最终答案,提高问答准确性。2.将KBQA任务简化为检索后生成的两阶段任务。在检索阶段将知识图谱文本化,利用BM25或者DPR等方法抽取和问题相关的文本,基于Bert进一步抽取排序靠前的三元组文本,作为生成阶段联合解码框架的输入。相较于主流的KBQA解决方案流程更短,避免了实体识别等子任务的累计误差。3.在数据集Web QSP和CWQ上进行测试,通过实验结果验证了该方法的可行性;基于该方法实现一个端到端的中医问答系统,测试结果进一步证明本文提出方法所具备的实际应用价值。
其他文献
近年来,基于选择性激光熔化的3D打印液压元件制造技术迅猛发展,与传统机械加工制造的液压元件相比,这种加工工艺可以直接一体成型更加复杂的流道结构,这也为轻量化、集成化、高性能和低泄露的液压集成阀块优化设计提供了制造工艺基础。然而由于增材制造技术本身限制,液压集成阀块内部流道的表面粗糙度并不理想,虽然已经存在许多表面抛光技术,但是对于抛光液压集成块内部流道都存在或多或少的缺点,本文结合现有磨粒空化射流
学位
随着全球对于可再生能源需求的增加,作为清洁能源的光伏发电得到巨大的发展,光伏电站的数量在过去的十年中呈现指数式增长。太阳能光伏发电站的大规模部署,复杂的当地气候和环境会导致光伏组件的缺陷故障,从而导致发电效率的下降,甚至产生安全问题。为了保证发电效率维持光伏电站的正常运行,同时减少光伏图像的人工标注成本,需要以高效低成本的方式对光伏电站进行巡检和故障诊断。本文对基于小样本学习的光伏红外图像缺陷检测
学位
面向工业领域的异常检测在现实工程中必不可少。随着工业的高速发展,针对工业生产的异常检测的必要性逐步体现。对于真实工业场景下的钢材表面出现的针孔、破洞、压印、折印等缺陷,需要及时地、准确地检测出来以降低风险,避免后续的一系列工业事故和经济损失。相比于高人力成本消耗、低效率、低精度的人工异常检测,基于视觉的机器智能化异常检测方向逐步体现出其价值意义所在。随着深度学习在图像分类、目标检测、语义分割等相关
学位
单机器人视觉同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)技术往往会存在构建地图效率低,当机器人发生故障或传感器失灵,整个工作就会停止。为了提高工作的稳定性,有很多学者进行了多机器人协同研究,但主要集中在利用稀疏地图进行多机器人间协同定位,无法完成人机交互、路径规划和避障等任务。针对以上问题,本文提出了一种多机器人协同构建语义稠密地图方法
学位
研究目的:莪术醇是临床上抗肿瘤中药莪术挥发油的主要成分,属于天然倍半萜类化合物,对多种肿瘤细胞均有着良好的抑制作用,但目前莪术醇的药代动力学和毒理学研究仍不充分,极大限制了莪术醇单体的进一步开发。本课题采用了规范的药代动力学和毒理学实验手段,研究了莪术醇的大鼠体内吸收、组织分布和血浆蛋白结合率等药代动力学特征,并开展了莪术醇的大鼠28天重复给药毒理学研究,阐明了莪术醇在大鼠体内的药代动力学和毒理学
学位
增材制造技术在复杂形状的金属结构件制造方面具有很大优势,但往往受限于成本与设备尺寸。固相连接通常采取传统焊接的方法,然而却存在焊接温度过高、焊接变形过大、内应力大,焊接裂纹等问题,因此需要一种技术克服以上问题。扩散连接技术是能够在保证被连接构件的整体形状不变形的情况下,实现增材制造与传统制造的材料完美冶金连接的先进连接技术。可以弥补增材制造技术的不足,在增材制造方面具有巨大的潜力。本文以粉末床激光
学位
糖类化合物在自然界中广泛存在,是一类重要的药效骨架,具有多种生物学活性如抗肿瘤、抗氧化、抗病毒、调节免疫等,在创新药物中具有重要的开发价值。其中,糖苷键连接糖基与糖基或非糖骨架,在糖类化合物结构修饰中扮演重要作用。本论文综述了芳基糖苷键的构建方法,现有的方法存在底物活化步骤长、底物受限、需要金属催化剂参与等不足。本论文还综述了含糖骨架大环内酯类药物塞拉菌素关键中间体的糖苷键水解工艺,现有的工艺难以
学位
五轴数控机床是航空航天、国防等领域中复杂曲面零件高精加工的关键装备。为了提高复杂曲面五轴数控加工的加工精度和加工效率,本文研究了五轴数控加工中的运动变换,对不同构型五轴机床的运动学进行分析,并建立了非线性误差通用模型;基于刀轨可行域和四元数球面插补法,对刀轨非线性误差进行插补优化;基于旋转轴与刀位点的等幅变换,提出了旋转轴运动特性优化方法;开发了复杂曲面高精加工的五轴机床非线性误差及运动优化系统,
学位
移动机器人不仅为人们的生活提供了便利,同时也极大地提高了生产的效率,被广泛地应用于社会的方方面面。轨迹优化作为移动机器人运动规划领域中的关键技术,是备受国内外研究人员关注的热点课题。轨迹优化的目的是将初始参考轨迹优化成一条满足各项约束条件的机器人可执行轨迹。在许多简单任务中,将移动机器人建模为一个质点能够进行高效的碰撞检测。然而,为了使机器人能够在复杂环境中灵活穿行,越来越多的工作致力于机器人非质
学位
随着工业互联网技术在工业控制领域的应用和发展,打破了传统工业以太网封闭运行的模式,增加了工业控制系统被外部攻击的风险。在目前的工业以太网中,数据以明文的方式进行传输和存储,存在泄露和被篡改的风险。为了提高数据传输的机密性、完整性和可用性,引入了密码学技术。但是在数据传输安全提高的同时,数据传输的耗时也会随之增加,特别是在对大规模时序性数据进行加解密时,会严重影响到工业数据传输的实时性。本文针对以上
学位