知识驱动的对话生成技术研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:sky11731
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的飞速发展,人机对话系统有望代替目前主流的输入设备,成为人们最常用的人机交互方式。对话生成是对话系统中最重要的环节之一,它是指计算机基于一定的对话信息自动生成一段对话回复,由于其生成的结果将直接反馈给用户,因此该任务完成得好与坏将极大地影响用户的使用体验。近年来,深度学习技术的飞速发展为对话生成带来了新的机遇,基于深度学习的对话模型能够从海量的对话数据中学习对话特征,自动生成相应的回复。然而,在实际的应用中,人们发现仅通过学习对话数据而训练得到的对话系统不能很好地满足用户的需求,这些对话系统往往趋于生成信息量比较低的回复,例如“我不知道”这一类通用回复,这类回复往往会让人丧失聊天的欲望。语言的表达与知识是密不可分的,有了知识的支撑,语言才变得丰富多彩。知识能够为对话系统提供额外的有用信息,在对话系统中引入知识能够缓解其易生成通用回复的问题,使回复更具多样性。本文将研究知识驱动下的对话生成任务,即在对话生成的过程中,合理地运用知识,将知识融入到深度学习模型中,使其产生的回复包含更多的信息、更具多样性。本文的主要研究工作如下:(1)本文提出基于注意力机制的知识对话生成模型(KDG-Att)。不同的对话语境下需要的知识是不同的,因此需要对知识进行选择,KDG-Att模型利用注意力机制为每一条知识分配不同的权重,以筛选出与用户对话最相关的知识信息来辅助回复的生成。另外,为了让回复包含更多与知识相关的有效信息,该模型在训练过程中,除了考虑生成的回复与真实回复之间的误差外,其目标函数还额外地衡量了生成的回复与知识之间的关联性来指导模型参数的学习,使训练后的模型更倾向于生成与知识相关的回复。本文设计了多个对比实验验证了 KDG-Att模型的有效性,实验结果表明本模型能够生成质量更高、更有意义的回复。(2)本文提出一种动态知识对话生成模型(DKDG-MD)。在对话生成的过程中,随着回复逐步产生,已产生的回复会使对话状态发生改变,所需用到的知识往往也会随之发生变化。该模型能够从所有的知识中自动地选择与当前对话状态最相关的知识参与解码,并随着对话状态的改变不断地更新所需利用的知识。本文对比了多个模型和DKDG-MD模型在中英文数据集上的表现,实验结果表明该模型表现更加优秀,生成的回复具有更丰富的信息。
其他文献
互联网上包含数十亿的文本信息,并且每天都以指数级形式飞速增长,人们难以快速、准确地从这些文本中甄别出有价值的信息。因此,有必要提供一种可以及时访问和快速消化各种信
高中物理作为高中理学教育阶段的一门重要学科,可以帮助学生认识世界并培养理科思维。近年来我国的科学教育对核心概念的关注度不断提高,在2017年颁布的《普通高中物理课程标
群体参照效应是指人们对自己所在的群体信息的记忆效果优于记忆其他群体的信息。每个人都会属于多个不同的群体,拥有不同的身份,个体所属的群体和相应的社会文化背景会对其产
近年来,得益于云计算的不断发展,安全外包计算作为云计算的重要应用之一,受到了学术界和工业界的广泛关注。安全外包计算中,云可以为资源受限的用户提供计算、存储等多方面的
传统的圆柱形覆膜锂电池圆周面破膜检测都是釆用人眼检测,人眼存在速度慢,易疲劳的弊端,很难适应高速电池生产线的检测要求。机器视觉是一项新型的工业自动化检测技术,可以与
随着移动互联网技术的发展和社交网络的兴起,网络已经成为人们获取和发布信息的主要方式,爆炸式增长的信息在给人们生活带来便利的同时,过载的信息也开始困扰人们的生活。为
混凝土材料广泛应用于建筑工程,桥梁工程等领域,随着建筑结构和建筑技术的发展,对混凝土材料破坏的控制要求越来越高,因此研究混凝土的断裂破坏机理对相关工程领域有重要意义
铝合金无缝气瓶内表面缺陷的检测是提高企业竞争力、改进生产工艺的关键环节之一。以往的气瓶缺陷检测方法主要是工人使用内窥镜进行多角度观察,不仅准确率低,还难以满足生产
含磷有机化合物在生物医药、农业、新型阻燃材料、有机合成及不对称催化等领域有着广泛的应用。其中,炔基膦化合物(含有spC-P键)因其具有独特的碳碳三键,通过一定反应条件可
水源水库作为地表水的主要存在形式,已成为重要的饮用水水源。水污染中以水体富营养化最为严重,其中氮素是导致水体富营养化的最关键因素之一。本文从李家河水库沉积物中筛选