基于深度学习的对话状态追踪研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:luoxing1984
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人机对话作为自然语言处理的一个重要分支,旨在使普通人能够使用自然语言与机器进行交互,以方便快捷的方式获得自动信息服务。现有的人机对话系统主要可分为闲聊型和任务型两大类。任务型对话系统包含自然语言理解(Natural Language Understanding,NLU)、对话状态追踪(Dialog State Tracking,DST)、对话策略(Dialogue Policy,DP)和自然语言生成(Natural Language Generation,NLG)四部分。其中,对话状态追踪利用多轮次用户与系统的对话信息,对状态进行实时更新,决定系统采用的响应方式,是系统做出决策的基础,具有重要意义。近年来,相关研究将自然语言理解集成在对话状态追踪任务中,以端到端的方式联合建模,消除了传统方法中存在各个模块间误差累积的问题,取得了很大进展,但依然存在一些问题,如:1、随着对话的进行,对话层次结构越来越深,模型在预测当前对话状态时,往往不能充分利用之前的对话信息,造成难以建模对话文本中长距离依赖关系的问题;2、每种槽位类型的训练语料通常是有限的,当标注数据不足时,基于深度学习的模型难以充分提取对话语义特征以及被充分训练。本文针对上述问题展开研究,充分利用语义信息进行对话状态追踪,主要工作包括:1、针对难以建模对话文本中长距离依赖关系的问题,提出多领域级联对话状态追踪模型(Multi-domain Cascaded Dialogue State Tracking Model,Mu Ca)。将对话状态追踪任务建模成序列到序列任务,包含一个由级联神经网络组成的编码器、一个上下文增强的槽门和一个状态生成器。编码器具有两层结构,底层采用卷积神经网络(Convolutional Neural Network,CNN)获得低维句子表示,顶层采用门控循环单元(Gate Recurrent Unit,GRU),在低维句子表示的基础上融合对话文本时序信息,构建具有局部和全局上下文归纳偏差的模块以进行序列学习;状态生成器利用软复制机制从对话和词典中追踪对话状态,实现跨域共享参数,追踪测试集上的未知槽值;槽门用于判断当前解码的领域-槽位对是否存在于当前对话中。在Multi WOZ和Cross WOZ数据集上的实验结果表明,Mu Ca模型能够改善难以建模对话文本中长距离依赖关系的问题,达到更高的联合准确率和槽位准确率。2、针对在标注数据不足的情况下语义提取不充分的问题,提出混合BERT对话状态追踪(Hybrid BERT Dialogue State Tracking,Hy BERT)模型。模型包含编码层、注意力层和分类层三部分。编码层使用BERT(Bidirectional Encoder Representation from Transformer,BERT)作为编码器,分别编码对话文本和本体中预定义好的所有候选槽值对,充分利用大规模无标注数据挖掘对话中丰富的语义信息;注意力层计算对话文本表示与候选槽值对表示之间的语义相似性;分类层判断候选槽值对是否出现在当前轮次对话中来进行状态追踪。模型训练过程中使用focal loss代替传统的交叉熵损失来解决正负样本不平衡的问题。实验结果表明,Hy BERT模型采用基于预训练加下游任务微调的方法,可以有效缓解训练数据不足时语义提取不充分问题,加快模型收敛的速度,在小规模数据集DSTC2和Wo Z 2.0上均达到更高的状态追踪准确率。
其他文献
磨损与腐蚀是机械零部件最常见的表面失效形式,是表面工程技术领域最值得关注的研究对象。由磨损与腐蚀导致机械零件的损坏严重影响机械设备整体的使用寿命,造成了极大的经济损失。表面失效与材料的表面特性密切相关,因此,表面改性是提高工程构件使用寿命和安全可靠性的有效途径。如今,表面硬化、热处理、表面涂层等多种工艺被用来改善材料表面性能。由于可以提供更好的外观和卓越的性能,表面涂层已经被广泛接受并成为重要的改
学位
众包技术是伴随着互联网的普及而出现的新型工作模式,即外包工作给互联网工人。随着机器学习技术的发展,标注数据集的缺乏日益成为性能瓶颈。传统的专家标注数据方式耗时费力,众包以其廉价、快速的特点成为标注海量数据集几乎唯一可行的方法。然而由于众包工人和任务的缺陷,结果中往往带有噪声,如何从嘈杂的众包结果中挖掘出高质量的数据成为研究热点。目前的众包研究主要关注质量控制和成本控制问题,而完善的工人与任务模型是
学位
<正>尽管当下的小学数学教学制度已经完善,但是随着对教学要求的不断提高,当下对小学数学教育也提出更高的要求。随着科学技术融入小学数学教学课堂,演变出的教学方法层出不穷,其中情景教育对小学数学课堂有更好的促进作用。为了进一步提高小学数学课堂教学效果,本文将对目前情景教学存在的问题进行挖掘,通过分析情景教学的特点和作用,探讨如何在科技发展环境下开展小学数学教学与情景教育的融合。
期刊
<正>党的二十大报告擘画了以中国式现代化全面推进中华民族伟大复兴的宏伟蓝图,是新时代全面建设社会主义现代化国家的理论指南和行动纲领。税收事业是党和国家事业的重要组成部分,税收现代化是中国式现代化的重要内容。全国税务系统深入学习宣传贯彻党的二十大精神,将税收现代化置于中国式现代化的理论和实践发展中进行认真思考、积极研究、建言献策,主动探索如何更好发挥税收职能作用服务中国式现代化。
期刊
小学语文教学应与学生的生活相联系旨在开扩学生的视野,提高学习语文的兴趣。本文将分析生活对语文教学的意义并探讨如何实现小学语文教学的生活化以此提高语文教学的教学质量。
期刊
已有文献较少从创新效率的无效性角度关注创新激励政策的作用。随着国家创新激励政策实施力度不断加大,强化政策实施精准性与有效性已成为提高企业创新系统整体效能的重要支点。基于中国A股上市公司面板数据,运用DEA两阶段模型从企业创新无效性的视角剖析典型创新激励政策——高新技术企业优惠税率政策对处于不同生命周期阶段的企业创新无效性的影响与作用机制。分组描述性统计结果显示,成熟期企业所受税收优惠、企业规模和员
期刊
随着网络与人们生活越来越紧密的结合,每个人都成为互联网上信息的生产者,每天有海量的数据在产生,信息检索成为了一个十分重要的课题,人们对于信息检索的需求也不再是单纯的用关键字查找相关文本,而是文本、图片、音频、视频等各种模态的数据互相检索查询,因此跨模态检索成为了信息检索方法研究的热点。跨模态哈希方法由于其额外空间占用低、检索速度快的特点成为了跨模态检索问题的一个优秀解决方案,因此受到越来越多的研究
学位
随着互联网大数据和信息技术的飞速发展,各类社交平台相继兴起,随之而来的是海量的数据,其中大部分是文本数据,而如何从文本中提取出有价值的部分,则正是自然语言处理的研究内容。在这些文本数据中,又以陈述句居多,如何针对这些句子,提出合理的问题,正是问题生成所要解决的。如今的在线教育行业正向以人工智能、大数据为基础的智慧教育发展,在这其中,需要为学生提供更多针对性的评估方法,这些往往都是以提问的方式出现。
学位
新兴的在线新闻平台为人们获取信息提供一种新的途径,随着这些平台上各种新闻数量的爆炸性增长,人们在海量新闻中很难找到有价值的话题。因此,如何从各种在线新闻中发现有意义的话题成为一项重要任务,新闻话题检测技术应运而生。新闻话题检测是话题检测与跟踪(Topic Detection and Tracking,简称TDT)的子任务,近年来引起广泛关注。通常,一个话题可以被认为是在特定时间或地点发生的特定事件
学位
近年来,全球癌症发病率呈逐年上升趋势,其中女性乳腺癌的发病率已经超过肺癌,已经成为影响女性健康的主要疾病之一。对乳腺癌症患者进行精准生存预后判断是当前乳腺癌研究领域的关键问题。准确的生存预后作为癌症预后的重要研究内容之一,在临床决策、建立姑息治疗体系等方面具有重要意义。与此同时,基因测序技术和数字影像技术的发展带来了海量的癌症组学和病理图像等多模态数据,为乳腺癌患者生存期预测研究提供了坚实的数据基
学位