论文部分内容阅读
互联网的极速发展带来了信息的爆炸式增长及其结构的杂乱无章。为此,知识图谱应运而生并获得了长足的发展。现如今,知识图谱被普遍应用于搜索引擎,推荐系统,智能问答,对话系统等领域中。本文主要侧重于知识图谱在任务型对话系统中的应用。在实际应用中,一个任务型对话系统一般会涉及多个领域的知识,分别对应着不同领域的知识库。这些知识库往往有着不同的来源。这些不同的知识源往往会由不同的技术人员进行维护,且具有异构的分布和属性。这会导致知识库很难甚至无法直接应用于任务型对话系统中。所以,我们需要借助于知识融合模型,将这些异源的知识库融合为一个知识库,然后再将融合后的知识库应用于任务型对话系统中。在任务型对话系统中,用户的意图识别具有非常重要的作用。准确地理解用户的意图可以加快解决用户的问题,提升用户的对话体验。然而,当前很多研究选择采用深度神经网络作为意图识别分类器。这种分类器是一个黑匣子,缺乏可解释性。而知识图谱则富含大量的结构化的知识,为意图识别模型的可解释性提供了可能。因此,在基于知识图谱的任务型对话系统中,知识融合和基于知识图谱的用户的意图识别成为了两个至关重要的技术。其中,知识融合是构建基于知识图谱的对话系统的理论基础。用户的意图识别则是任务型对话中不可或缺的一部分。于是,本文主要对知识融合和基于知识图谱的用户意图识别展开研究。首先,本文以融合具有部分-整体关系的知识图谱为例,对具有大量完全独立的连通分支,并且训练集和测试集之间没有重叠实体的知识图谱融合进行研究。为了解决此类问题,我们引入了相似度作为辅助信息,并提出了一种基于三元组张量和相似度矩阵进行联合分解的模型。其中,由于知识图谱中关系的独立性,模型使用RESCAL方法对三元组张量进行分解。之后,我们采用交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)对模型进行优化。在实验中,通过和RESCAL模型以及TransE系列的模型进行对比,本文提出的模型在准确率上表现了最好的效果,很好地解决了即将融合的知识图谱中具有大量完全独立的连通分支,以及训练集和测试集之间没有重叠实体的问题。借助于知识融合技术,我们可以将多个领域的知识库融合为一个知识库,并应用于任务型对话系统中。在任务型对话系统中,知识图谱能够帮助系统快速准确地识别用户的意图,并使得系统具有很强的可解释性。因此,本文提出了基于意图图谱的用户意图识别模型。该模型将融合后的多领域知识库转换为表示用户意图的知识图谱,即意图图谱。然后,模型使用强化学习的方法在图谱中进行推理来获取合适的路径。该路径中的最后一个节点即为用户的意图。在实验中,通过和监督学习的模型对比,该模型在表现出较高的意图识别准确率的同时,具备了很强的可解释性。这有助于我们能够快速了解模型产生的错误样例,并及时提出方法进行改进。综上所述,本文主要围绕知识图谱在任务型对话系统中的两个关键技术展开研究。这两个技术为知识融合和基于知识图谱的用户意图识别。其中,知识融合是构建基于知识图谱的对话系统的理论基础。为了便于在任务型对话中使用多领域知识库,我们使用知识融合技术将多领域知识库融合为一个知识库。用户的意图识别则是任务型对话中不可或缺的一部分。知识图谱的应用使得用户的意图识别模型具有很强的可解释性。首先,我们提出了张量和矩阵的联合分解模型,对具有大量完全独立的连通分支,并且训练集和测试集之间没有重叠实体的知识图谱进行融合。之后,我们基于融合后的知识图谱提出了用户的意图识别模型。该模型将融合后的多领域知识库转换意图图谱,并使用了强化学习的方式生成路径,对应于用户的意图。这两种模型都具有很好的实验结果。不过它们还有很多的提升空间。例如知识融合模型产生的一些错误样例是有悖于常识;意图识别模型在准确率上仍然不如监督学习模型等。这些都需要我们进一步的深入研究。