面向开放域对话的回复生成模型的研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户：wgy_2003_9

【摘要】

：

【作者】

：

杨云帆

【机构】

：

电子科技大学

【出处】

：

电子科技大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

近年来,随着大规模并行计算技术的进步,基于神经网络的对话系统得到快速发展。但是,当前开放域对话系统依然存在以下问题:对话模型容易生成上下文无关、不合语法甚至自相矛盾的回复。模型未能较好的完成自然语言理解与生成任务。本文的研究主题在于构建一个能生成高质量回复的开放域对话系统,在预训练语言模型的基础上,从语言理解与对话生成角度对原有模型进行改良。本文的主要内容可以归纳如下:1)提出了一种引入真实回复信息的回复感知对话模型。本文使用回复感知方法提取真实回复中的潜在信息,然后结合预训练模型的对话生成能力,使模型能够生成更加贴近真实回复的输出。为了解决引入真实回复带来的曝光偏差问题,本文采用计划采样与回复预测方法来缩小模型输入在训练和生成阶段的差异。实验结果表明联合使用计划采样回复预测方法,模型能够获得更好的效果。此外,考虑到预训练模型和循环神经网络在模型架构上的差异,本文对计划采样方法进行了改进,使之可以应用于预训练模型,提升了计划采样的计算效率。2)提出了一种基于自然语言推理机制的对话生成模型。本文通过自然语言推理对复杂繁多的对话上下文进行筛选,过滤其中的无关信息从而对模型输入进行校正。为了提升语言推理的准确性,模型从对话上下文与真实回复两个角度应用自然语言推理管理对话上下文。实验结果表明,过滤后的对话上下文能够引导模型产生更好的回复。最后,本文还将自然语言推理用于评估模型生成的回复与上下文的一致性,拓展了自然语言推理在对话系统中的应用。3)基于改进的对话模型,本文采用软件工程的方法,分析、设计和实现了一个对话系统。总体来说,本文的工作重点是提高开放域对话系统中生成回复的质量,主要思想是提高模型对真实回复和对话上下文的语言理解能力。自动评估和人工评估结果都证明了所提出方法的有效性。

其他文献

基于人脸图像生成技术的面孔社会特征认知研究

绘画可以成为科学研究的重要来源,许多学科的研究人员会从画作的各个方面提取所需要的信息,这些学科包含了艺术、经济、历史、文学、政治等等。然而绘画并没有广泛地应用于由心理学、神经科学和行为经济学的实验中。绘画虽然是一种类似于按下键盘或者填写问卷的行为输出,但是用传统的方法很难对绘画的主观表现和艺术表现进行客观的衡量也是事实。此外,作为行为实验的典型参与者,普通人并不具备基本的绘画技巧,这使得他们的画作

学位

基于轨迹运动参数符号化表示的多源时空相似性算法

随着记录移动对象多维运动状态的传感器技术的发展,产生了大量的运动行为轨迹数据。通过衡量这些轨迹数据的相似性,对研究不同移动对象之间的运动行为模式有重要意义。尽管已经出现了大量的轨迹相似性算法,但是他们普遍存在以下几个缺点:他们大多数都被限制在移动对象运动路径的静态几何曲线上,只有很少的工作将移动对象的轨迹运动参数考虑在内,在多维复杂的研究场景中,单靠空间相似性不足以判定移动对象之间是否存在相似的运

学位

基于事件触发的奇异马尔科夫跳变LPV系统的控制与滤波

马尔科夫跳变系统是由多个子模态构成的具有随机切换规则的系统,它能够很好地描述具有随机参数变化的系统,如内部元件故障和工作点变化。而半马尔科夫跳变系统作为一种更为一般的系统,其驻留时间并不完全遵循指数分布,还可以遵循Weibull分布、Gaussian分布等非记忆型分布。线性变参数（LPV）系统通过引入实时可测参数可以很方便地描述物理系统的时变特性和非线性特性,并且广泛应用于导弹自动飞行、涡扇发动机

学位

全面从严治党新部署视角下国企强根铸魂工程研究

＜正＞坚持党的领导，加强党的建设，是国有企业的“根”和“魂”，是我国国有企业的光荣传统和独特优势。党的二十大报告对党的建设作出新部署、提出新要求，在守正创新中深化了对建设长期执政的马克思主义执政党自身建设的规律性认识，实现了马克思主义建党学说中国化时代化的理论创新与实践创新。新时代新征程上，国有企业党组织以党的二十大精神为指引，深入学习践行党的建设理论创新成果，统筹实施铸魂工程、领航工程、固本工程

期刊

文脉延续视角下青岛历史城区居住建筑屋顶形态优化研究

青岛是一座文化底蕴深厚的城市,经历过三次帝国主义列强的殖民,留下了大批“红瓦坡顶形态”的西方传统居住建筑,坡屋顶的建筑形式渐渐成为了这座城市的标识。但随着城市建设步伐的加快,曾经主导城市风貌的建筑屋顶形式逐渐在城市建设中消失,导致历史城区内殖民时期居住建筑屋顶形态的对外延展,呈现断层模式,新旧建筑之间缺乏过渡,整体定位模糊。加之国务院等相关建设部门出台了一系列政策,引导旧城的更新方向,以保护与延续

学位

基于深度学习的事件抽取技术研究与应用

事件抽取是信息抽取中的一个较为复杂的课题。在实际的工业管理软件领域中,事件抽取在处理客户投诉等工作中具有极高的应用价值,能够帮助企业实现产品的快速更新迭代和保持用户粘性。事件抽取不仅是目前自然语言处理的研究热点和难点,也在知识图谱相关任务中发挥着重要作用。事件抽取的任务目标是将非结构化的自然语言文本进行结构化的处理,从中自动抽取用户所需要和关注的事件信息并进行存储。目前BERT为代表的预训练模型能

学位

非结构网格DSMC的大规模并行计算研究

直接模拟蒙特卡洛方法（Direct Simulation Monte Carlo,DSMC）是目前求解稀薄气体领域真实气体流动问题的一种强有力的工具。非结构网格作为DSMC方法的一个重要分支,在复杂几何外形的计算网格生成方面具有自动化程度高、生成周期短、分布控制灵活等优点,已被DSMC工程计算广泛采用。然而,随着应用的不断扩展,非结构DSMC求解的问题越来越复杂,对计算与存储量的需求日益增加,开展

学位

基于实体链接的关联知识发现技术研究与应用

当今世界正处在一个信息爆炸的时期,从繁杂的信息中检索出需要的信息是困难的,也是必要的。由此,知识发现技术得到飞速发展,以知识图谱为基础的关联知识发现系统,通过利用实体及关系信息,能够挖掘出深层的关联信息。但是,由于网络信息具有噪声混杂、知识稀疏的特点,如何从海量信息中提取出有效信息,并转化为知识图谱中结构化知识,是目前研究的一个热点问题。通过对自然文本进行清理,筛选出缺少的知识,最后利用实体链接技

学位

基于量子低密度奇偶校验码纠缠度及其译码器方案研究

随着机器学习以及大数据时代的到来,量子编码理论逐渐成为量子通信发展的焦点。针对量子编码,国内外研究学者提出了量子纠错码构造方法,这是量子编码众多方法之一也是其必经之路。在构造量子纠错码过程中,量子纠错码纠缠度和低损耗译码误帧率（FER）是判定量子纠错码是否有效纠错的重要标准。由于量子纠错码受到高维图态不易构造以及量子纠错码纠错也会受到环境中噪声或信道中随机扰动强度等问题的限制,本文从量子纠错码纠缠

学位

基于IBM Qiskit的量子图像处理算法及其仿真

随着科技的不断发展,信息化社会的计算数据量急剧地增长;同时根据摩尔定律计算机芯片内部集成度也越来越高,集成芯片受“尺寸效应”和“热耗效应”上限的影响。凭借量子态叠加,纠缠以及测量塌缩的特性,量子计算为未来科学技术的进步提供新的计算思路。数字图像包含诸多信息在互联网上广泛存在,因此近些年图像处理技术快速地发展。量子图像处理技术是结合量子计算方向和经典图像处理方向的新兴领域,其目的是把传统图像处理任务

学位

面向开放域对话的回复生成模型的研究与应用

与本文相关的学术论文