知识融入的端到端任务型对话系统研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:zhangsanzong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
流水线式任务型对话方法通过对话状态跟踪模块将外部知识融入对话,但是该类方法设计复杂,需要大量人工标注。端到端方法将对话任务视为从对话历史到系统回复的映射问题,有着结构简单、可扩展性强的优点。但是,现有端到端的方法难以使用对话状态跟踪模块进行外部知识库检索,从而无法将外部知识融入对话过程。针对该问题,本文的创新工作和主要内容包括:(1)本文在端到端模型中引入对话状态,提出一个对话状态指导的端到端任务型对话系统(An End-to-End Task-Oriented Dialogue System Based on Dialogue States,DS2Seq),以实现端到端任务型对话系统的知识库检索能力。该系统采用一个信息存储结构存储知识库和对话历史,并使用一组可学习的向量表示对话状态以辅助系统进行知识库检索。然后通过解码器将知识库和对话历史中包含的知识信息融入到生成的回复中。(2)本文基于现有记忆网络增强的任务型对话方法,提出一个基于层次型记忆网络的端到端任务型对话系统(A Hierarchical Memory Model for End-to-End Task-Oriented Dialogue System,HM2Seq),通过记忆网络自身的阅读和推理能力将知识信息融入对话过程。该系统采用一个层次型记忆网络存储分别对话历史和知识库,并用知识行替代三元组的形式表示知识库信息,以提高记忆网络的知识推理能力。最后通过层次型记忆网络强大的阅读和推理能力将知识融入到解码器的回复生成过程中。(3)本文在两个常用的任务型对话数据集SMD和CamRest上进行实验,通过与多个现有方法和效果最好的方法进行比较,对模型的信息抽取、语言建模及知识融入能力进行评估。实验结果表明,本文提出的DS2Seq和HM2Seq都取得了很好的效果,能将知识较好地融入到对话中。本文还对两个模型分别进行消融实验,验证了模型各部分对系统整体性能的影响。此外,本文针对HM2Seq进行了人工评估实验以更细粒度地评估该模型,并将注意力可视化以展示该模型的生成过程。
其他文献
近来,目标跟踪技术应用愈发广泛,尤其是在许多工业应用中起着不可替代的作用。为了适应复杂多变的跟踪环境,热红外摄像机也被运用到视频图像采集中。热红外图像可以补充解决可见光下的光照条件敏感问题,可见光图像又可以助力解决热红外图像中的热交叉问题。可见光摄像机采集RGB数据,热红外摄像机采集T数据,这两种模态数据提供了强大的互补信息,将“RGB+T”数据联合完成跟踪,从数据的角度来说也被称为RGB-T跟踪
学位
随着科学技术的发展,互联网的崛起为人们带来了方便快捷的实时通讯,非结构化形式的网络文本数据呈指数级别增长。信息来源不同、用户用语习惯不同导致文本数据多变且无特定规则,这阻碍了计算机理解文本含义以及分析出精准有效的信息。实体链接就是解决这一问题的关键任务。作为自然语言处理领域的基础性工作,实体链接旨在将文本中有歧义的实体指称项映射到给定的大型知识库中从而消除实体指称项的歧义。本文通过调研实体链接国内
学位
在日常生活中,优化问题无处不在。科学技术的迅速发展逐步加剧了生活中实际面临优化问题的复杂度。对于求解复杂的优化问题,群智能优化算法有着效率高、适应性广的优势。粒子群优化(Particle swarm optimization,PSO)算法是一种常用的智能优化算法,它具有参数少、收敛速度快、易于编程等优点,将PSO算法应用在实际问题中,能够获得良好的性能。但由于存在过早收敛和全局搜索能力的薄弱的缺点
学位
现代化发展中城市的扩张与人口的增长使得相关的交通问题愈发严重,尤其是道路利用率低下和交通堵塞的问题。交通流预测旨在根据城市交通网络中的路网结构和历史交通流数据等信息对未来时刻的交通状态进行预测,有利于广大用户提前做好出行规划和政府合理规划城市交通,是目前解决上述交通问题的重要手段之一。然而,交通信息中存在由复杂的道路网络和动态的交通条件所带来的复杂时空依赖性,且时空特征之间相互关联和相互影响。因此
学位
随着移动互联网技术的发展,社交网络已成为人们日常生活的重要组成部分。大量有价值的信息在社交网络中传播,这些信息的分享为人们生活提供便利的同时也给用户带来了极大的隐私威胁。社交网络合成图作为一种既能表示原始社交网络属性又不泄露真实数据的生成图数据,可以供数据收集者分析出准确的网络属性特征。本文以差分隐私模型为基础,研究如何将本地化隐私保护的数据收集机制和社交网络图合成机制有效地结合,从而保护社交网络
学位
传感器技术是当代信息产业的重要支柱之一,随着物联网技术的不断发展,传感器越来越多地应用到了人们生产生活的各个领域,与之如何有效分析这些数据,充分挖掘传感数据所隐含信息是一个重要的研究课题。基于机器学习和深度学习的时序传感数据分类算法已经得到广泛应用,相比传统方法能更好地提取数据深层次的特征,可以达到更好的识别效果。然而,此类方法往往依赖于大量有标签的训练样本,而这在许多实际情况下是难以获得的。迁移
学位
表情识别是研究和判别人类情绪的一种重要途径,随着社会的不断进步,情绪的价值和表达也越来越受到关注和重视。本文通过调研发现,在虚拟现实(Virtual Reality,VR)情境下,特别是沉浸式VR情境下,参与者的情绪会由于VR高度的沉浸感和真实感得到更充分自然的引发和调动。此时参与者的情绪状况可通过愤怒、轻蔑、恶心、恐惧、高兴、悲伤以及惊讶七种表情进行识别和监测。然而使用沉浸式VR的头戴式显示器(
学位
根据第七次全国人口普查主要数据显示,我国正逐渐步入老龄化社会,老年人的健康看护问题需要重视。通过步态来检测独居老人的异常情况并预警,可以给予其及时的帮助。因此,本文提出了基于震动信号的异常步态识别方法,主要的创新性工作有:(1)设计开发了震动信号采集系统。该系统以智能硬件为基础,针对多传感器协作采集数据时,各传感器采集到的数据不一致甚至不同步的问题,提出了基于二阶矩的信号分割方法用于从采集数据中识
学位
随着越来越多的图卷积网络(GCN)成功应用于推荐任务,人们发现训练大规模GCN十分困难。由于随着图卷积网络层数增加,嵌入学习需要聚合的邻居数量出现指数级增长,造成的结果是基于小批量梯度下降算法的图卷积网络模型计算成本高昂。为了解决以上问题,本文提出了基于聚类图卷积网络的推荐算法(Clustering Graph Convolutional Network for Recommendation,Re
学位
二值图像的骨架提取是将其图像中的前景像素缩减为骨架形式的方法。提取得到的骨架保留了原图的拓扑、几何性质。骨架提取常常作为图像分类、数据聚类中的预处理步骤,以达到特征提取、数据降维的效果。常见的二值图像骨架提取算法分为三类:基于形态学、基于中轴变换、基于形状分解。目前的骨架提取算法已逾一千种,然而其通常难以得到单像素宽度的骨架,冗余像素较多,并且算法抗噪能力差。本文提出一种基于k最近邻居的二值图骨架
学位