基于张量分解的知识图谱融合研究及其在对话中的应用

来源 :山东大学 | 被引量 : 0次 | 上传用户:dddddddaaaaaaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的极速发展带来了信息的爆炸式增长及其结构的杂乱无章。为此,知识图谱应运而生并获得了长足的发展。现如今,知识图谱被普遍应用于搜索引擎,推荐系统,智能问答,对话系统等领域中。本文主要侧重于知识图谱在任务型对话系统中的应用。在实际应用中,一个任务型对话系统一般会涉及多个领域的知识,分别对应着不同领域的知识库。这些知识库往往有着不同的来源。这些不同的知识源往往会由不同的技术人员进行维护,且具有异构的分布和属性。这会导致知识库很难甚至无法直接应用于任务型对话系统中。所以,我们需要借助于知识融合模型,将这些异源的知识库融合为一个知识库,然后再将融合后的知识库应用于任务型对话系统中。在任务型对话系统中,用户的意图识别具有非常重要的作用。准确地理解用户的意图可以加快解决用户的问题,提升用户的对话体验。然而,当前很多研究选择采用深度神经网络作为意图识别分类器。这种分类器是一个黑匣子,缺乏可解释性。而知识图谱则富含大量的结构化的知识,为意图识别模型的可解释性提供了可能。因此,在基于知识图谱的任务型对话系统中,知识融合和基于知识图谱的用户的意图识别成为了两个至关重要的技术。其中,知识融合是构建基于知识图谱的对话系统的理论基础。用户的意图识别则是任务型对话中不可或缺的一部分。于是,本文主要对知识融合和基于知识图谱的用户意图识别展开研究。首先,本文以融合具有部分-整体关系的知识图谱为例,对具有大量完全独立的连通分支,并且训练集和测试集之间没有重叠实体的知识图谱融合进行研究。为了解决此类问题,我们引入了相似度作为辅助信息,并提出了一种基于三元组张量和相似度矩阵进行联合分解的模型。其中,由于知识图谱中关系的独立性,模型使用RESCAL方法对三元组张量进行分解。之后,我们采用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)对模型进行优化。在实验中,通过和RESCAL模型以及TransE系列的模型进行对比,本文提出的模型在准确率上表现了最好的效果,很好地解决了即将融合的知识图谱中具有大量完全独立的连通分支,以及训练集和测试集之间没有重叠实体的问题。借助于知识融合技术,我们可以将多个领域的知识库融合为一个知识库,并应用于任务型对话系统中。在任务型对话系统中,知识图谱能够帮助系统快速准确地识别用户的意图,并使得系统具有很强的可解释性。因此,本文提出了基于意图图谱的用户意图识别模型。该模型将融合后的多领域知识库转换为表示用户意图的知识图谱,即意图图谱。然后,模型使用强化学习的方法在图谱中进行推理来获取合适的路径。该路径中的最后一个节点即为用户的意图。在实验中,通过和监督学习的模型对比,该模型在表现出较高的意图识别准确率的同时,具备了很强的可解释性。这有助于我们能够快速了解模型产生的错误样例,并及时提出方法进行改进。综上所述,本文主要围绕知识图谱在任务型对话系统中的两个关键技术展开研究。这两个技术为知识融合和基于知识图谱的用户意图识别。其中,知识融合是构建基于知识图谱的对话系统的理论基础。为了便于在任务型对话中使用多领域知识库,我们使用知识融合技术将多领域知识库融合为一个知识库。用户的意图识别则是任务型对话中不可或缺的一部分。知识图谱的应用使得用户的意图识别模型具有很强的可解释性。首先,我们提出了张量和矩阵的联合分解模型,对具有大量完全独立的连通分支,并且训练集和测试集之间没有重叠实体的知识图谱进行融合。之后,我们基于融合后的知识图谱提出了用户的意图识别模型。该模型将融合后的多领域知识库转换意图图谱,并使用了强化学习的方式生成路径,对应于用户的意图。这两种模型都具有很好的实验结果。不过它们还有很多的提升空间。例如知识融合模型产生的一些错误样例是有悖于常识;意图识别模型在准确率上仍然不如监督学习模型等。这些都需要我们进一步的深入研究。
其他文献
本文研究了半群作用动力系统中的敏感指数与传递紧的概念.在半群作用的动力系统中,我们分析了传递系统,弱混合系统中的各种敏感指数之间的联系,并且研究了传递紧与弱混合,弹性以及敏感性之间的联系.详细叙述如下:在第一章引言部分中,我们简单描述了动力系统的发展历程以及分支,并且介绍半群作用的动力系统中有关动力学性质的研究现状.在第二章中,我们介绍了敏感指数,传递紧和弹性的基本概念以及半群作用的动力系统中的相
本论文主要研究2-边染色与2-弧染色重载费用欧拉回路问题。对2-边染色重载费用欧拉回路问题,具体描述如下:给定一个2-边染色欧拉图G=(V,E),染色函数c:E→{1,2},重载费用函数r
光催化技术的应用在解决能源问题及环境污染问题方面具有广阔的前景。钒酸铋(BiVO_4)由于其合适的带隙、成本低、合成简单、光稳定性高、环境友好等特点,有望被应用于光催化分解水、光还原二氧化碳和光降解有机污染物等领域。但是,BiVO_4中的光生电子和空穴极易复合、光生载流子传输速率较慢,限制了其量子效率的提高。因此,对BiVO_4进行复合改性,从而提高其光催化性能,具有重要意义。Sillen铋系化合
随着能源危机和环境污染的日益加剧,新能源的开发和利用备受社会关注。氢作为一种理想的能源载体,具有能量密度高,燃烧产物无污染等特点。然而如何安全高效的储存和运输氢气是发展和利用氢能的关键。水合肼(N_2H_4·H_2O)是一种非常有应用前景的化学储氢材料,其储氢含量高达8.0 wt.%,价格低廉,室温下性质稳定且便于运输。此外由于在常温下具有液态的物理性质,水合肼可以在现有的设备上直接使用,比NaB
通过查阅、研究国内各主要标本馆耳蕨属Polystichum Roth植物标本,结合野外考察,作者对属下的高山耳蕨组Polystichum Sect.Lasiopolystichum Daigobo和半开羽耳蕨组Polystich
密相流化床反应器具有结构简单、传热与传质效率高等优点。气固流化床内的多相流动是非线性、非均匀的气固两相流系统,并呈现出复杂的多尺度结构,前人对于气固流化床内介尺度
燃料电池是一种清洁高效的新型能量转换系统,通过将燃料中的化学能直接转化成电能,不存在卡诺循环,因而具有转换效率高的特点。并且由于燃料与氧气之间的反应没有气体污染物的排放,具有环境友好的特点。在如今环境污染和能源枯竭问题日益严峻的情况下,发展高效燃料电池具有一举两得的作用,因此燃料电池近年来发展十分迅速。特别是质子交换膜燃料电池(PEMFC)被认为是最有希望成为以后汽车的主要动力来源,因而对PEMF
研究非线性椭圆型偏微分方程的方法有很多,例如:不动点定理、上下界方法、拓扑度理论等等.本文主要是利用不动点理论解决两类问题;第一类是证明了一类半线性椭圆型方程边值问题的正径向解存在性,首先通过径向转化把已知问题转化成它的径向形式,再利用不动点定理讨论其径向形式解的存在性和唯一性以及不存在性,并给出了相应的实例去说明了定理的实用性;第二类是讨论了半线性椭圆型方程组在洞型区域内正解的存在性与唯一性,这
回归分析是统计中最常用的方法。特别地,均值回归、中位数回归被人们在实际生活中广泛的应用。近几十年来,由于缺失数据的兴起,不少学者对带有缺失数据的回归模型进行了全方
生物遗传统计及医学研究的重要课题之一是人类多基因疾病的研究,伴随着人类基因组计划的发展和完成,许多人类复杂性疾病得以发现,同时科学研究者们也找到了一些疾病的发病基