基于多任务学习和知识图谱的对话技术研究

来源 :华侨大学 | 被引量 : 1次 | 上传用户:hy85323
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,数据规模的指数级增长加剧了用户对以友好和自然的方式随时随地获取所需要信息的渴望,对话系统应运而生。对话系统作为一种新型的人机交互工具,能够通过自然语言的方式实现。按照应用范围的不同,对话系统可以划分为两类,分别是非任务型和任务型,本文的研究主要集中于任务型对话系统。作为任务型对话系统内部运行的机制,任务型对话模型的研究随着人工智能以及自然语言处理技术的蓬勃发展而越来越深入。但是,现有的任务型对话模型的研究存在以下问题:首先,作为自然语言理解模块中的重要组成部分,意图识别任务和槽填充任务之间的关联性非常显著,但在目前的研究中,很少能够充分利用二者之间的关联关系和共享信息。另外,由于在任务型对话模型中,用户输入文本长度有限,导致文本描述概念信号比较弱,文本特征严重不足。对话响应生成模块的作用是组织适当的应答语句,将模型的答复转换成用户能够理解的自然语言,现有的对话响应生成方法通常存在生成结果不可控的问题,部分生成的语句可能含有语法错误或造成歧义,又或者是信息量较少的无用语句。针对以上问题,本论文研究基于多任务学习和知识图谱的对话模型的构建,主要针对对话模型中的自然语言理解和对话响应生成两个模块进行,课题主要工作如下:(1)为了充分利用意图识别和槽填充之间的关联关系和共享信息,同时引入外部知识以增加文本特征,本文提出了一种基于多任务学习融合知识的意图和槽位联合识别模型。该方法通过以下三个部分充分利用意图和槽位之间高质量的关系信息以及外部的知识信息。首先,基于长短期记忆网络和卷积神经网络获得意图识别和槽填充两个模块之间的共享参数和特征;第二,将外部知识引入以改进上述联合识别模型的效果;第三,建立加权损失函数进行联合识别模型的优化。(2)目前的对话响应生成模型依赖于不充分的信息来生成响应,导致模型倾向于输出一般性的反应,生成的响应信息量不足。针对该问题,本文提出了一个基于知识图谱的对话响应生成模型,可以实现注入知识的序列到序列响应生成。该模型利用知识图谱模拟人脑本身存在的先验知识,并通过双重注意力机制和偏向生成概率实现注入知识的对话生成,并引入覆盖率机制解决输出部分重复信息的问题。(3)将多任务学习与知识图谱结合,实现任务型对话模型的构建,并将该对话模型应用于斯坦福大学所提供的餐馆订餐任务数据集,获取本文对话模型的测试效果。实验结果验证了本文构建的对话模型的可靠性及有效性。
其他文献
随着激光技术的飞速发展,激光和等离子体的相互作用成为了最热门的研究领域之一。当激光入射至冕区时,被等离子体吸收、反射和散射,在冕区附近将产生多种非线性作用,这些效应
为充分挖掘老区潜力,有力地促进老油田的可持续发展,本次研究在老区油藏精细描述的基础上,对安1-安97块太古界潜山油藏储层进行综合研究,搞清油藏裂缝的发育情况,建立可靠的
可重构机器人可以根据不同的任务需求对自身构形进行重新组合与配置,从而表现出许多传统机器人所不具有的优势。“模块化”与“可重构”作为可重构机器人设计的两大基本要求,
目前,自然场景文本检测已成为计算机视觉领域中的热门研究方向,交通标识文本属于自然场景文本的一种,它在无人驾驶系统的视觉感知环节中占有重要地位。尽管研究者们在交通标
如何在有限的资源下,实现低复杂度和高精度的大点数FFT算法成为信号处理系统的关键。而基于滤波器组的方法能够在低实现复杂度和高计算精度上均有较好的性能。本文针对在不同
近几年来,城市的快速发展对城市基础地理信息数据的现势性和准确性提出了更高的要求,而建筑物作为城市区域主要地物,其空间位置、形态尺寸等几何信息的及时更新尤其重要,如何
差分演化算法作为计算智能算法中的重要一员,因其结构简单、收敛速度快、鲁棒性强等特点,得到了研究学者的广泛关注并且在研究和应用上均获得了很大的进展。变异操作作为差分
铁电/半导体异质结由于在界面处存在晶格、电荷、轨道、自旋的相互耦合作用,拥有特殊的界面效应,能够展现出丰富独特的物理性质,在光伏、储能、信息存储领域中均表现出了优秀
超强激光设施的建设推动了强激光产生正负电子对的研究,为了进一步理解空间非均匀含时外场下的的Schwinger效应,本文利用数值求解含时Dirac方程的方法研究了强驻波激光场中非
作为一种新型的群体计算模式,众包现已成为近年来的研究热点之一,软件众包是众包的典型应用之一,由于其任务需求的多样性与工人能力的动态性和不确定性,使得软件众包过程中的