基于注意力机制的上下文主题对话生成

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:soboy1478
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能广泛应用的今天,对话系统作为自然语言处理的一大分支,或已成为衡量人工智能发展程度的一大标准。在对话系统的发展过程中面临着多种困难,如在多轮对话生成工作中如何将对话的历史信息更好的在生成中体现以及在对话生成过程中如何避免主题缺失等现象。在本文的研究中,旨在解决在开放域多轮对话生成过程中缺乏上下文信息和主题缺失的问题,论文研究了一种基于层次注意力机制的上下文主题对话模型。本文的主要工作如下:(1)设计基于上下文对话的模型,该模型利用层次化结构对上下文信息进行建模,并在该层次结构中引入了多粒度的注意力机制,设计词级别注意力机制、语句级注意力机制得到对话的上下文表示。(2)对多轮对话生成的主题预测进行研究,并在大型语料库Reddit上进行LDA主题模型的训练,通过此方式来对对话历史的主题信息进行建模,提取对话上下文中出现的主题进而预测主题的生成。(3)设计了基于上下文的主题预测的多轮对话生成模型,通过对基于上下文对话模型进行改进,使用预训练LDA主题模型对上下文中的主题进行提取,并将提取的主题词进行注意力计算,得到最终预测的主题,其次重新设计了解码过程中的概率模型,将主题预测模块加入最终的对话生成之中,使得模型在生成回复时考虑预测的主题,以缓解主题缺失的现象。最后,通过在三个公开数据集上的对比实验以及对所提出模块的消融分析,本文提出的基于注意力机制的上下文主题对话模型在效果上优于目前的基线模型,验证了本文提出的模型和研究。
其他文献
高光谱图像因其丰富的光谱信息而获得广泛的关注,但由于传感器硬件设备的局限性,使得高光谱图像的空间分辨率较低,这在很大程度上限制了高光谱图像的实际应用场景。为了解决这个问题,一种主流的做法是将低空间分辨率的高光谱图像与高空间分辨率的多光谱图像进行融合。高光谱图像作为一种典型的三维结构数据,具有光谱和空间两种重要属性,能否充分利用这些属性的特征成为融合算法非常关键的一步,为此,本文开展了如下工作:(1
学位
早期隔行(交错)视频通常包含复杂的交错横纹和各类压缩伪影,严重影响了主观视觉体验。尽管近年来针对早期视频的高清重建技术取得了很大进展,但有关视频去隔行研究依旧匮乏。随着人们对视频内容不断增加的多元化需求,早期经典视频的增强重建受到了越来越多的关注和应用。针对上述问题,本文提出了一种基于多帧的隔行视频联合增强模型,实现低质量隔行视频的交错去除,压缩伪影去除,超分辨率等增强任务,同时还将所提算法进行改
学位
随着整个社会进一步的网络化和数字化,越来越多的场合需要对人的真实身份进行有效认证。掌纹识别作为一种新兴的生物特征识别技术在过去二十年里受到了广泛的关注。感兴趣区域(Region of Interest,ROI)的准确提取是掌纹识别的关键步骤,直接影响后继的识别性能。然而,在已有的研究中,不同学者提取的ROI大小、位置、方向都不尽相同,为以后大规模应用带来潜在的隐患。深度学习在近年的计算机视觉任务中
学位
在数据大爆炸的时代,高维数据已广泛地存在于生产与科学研究领域。当前数据维度也变得越来越高,同时会带来研究上的困难,用传统的聚类方法对高维数据进行聚类将消耗非常大的计算量,这对有限的计算内存来说是一种很大的计算消耗和开销。如何有效地分析和管理这些数据信息变得非常重要,在复杂的该数据背景下聚类技术是对数据进行分类处理的重要手段。传统的聚类方法,如众所周知的模糊k均值算法,通常需要足够的数据才能找到一个
学位
考古遗存是古代先辈活动遗留下的客观实体和精神文明的物质载体,目前正面临着来自自然活动及人类活动的巨大挑战,数字化模型技术将为其延长生命并赋予新的活力。多视图三维重建方法具备相当便捷、高效和低成本的特点,是有力的数字化手段之一。作为历史遗存的物品纹理相似性很强,多视图重建流程中的特征提取准确性至关重要;另一方面,传统的多视图重建流程到点云或三角化网格即为完成,但历史遗存的展示性需求,希望数字模型拥有
学位
随着社交媒体和电子邮件的普遍使用,短文本在互联网上大量涌现。短文本分类任务在情感分析、垃圾邮件分类和新闻分类等领域中有广泛的应用。一方面,这些短文本数据长度限制和一词多义带来了数据稀疏性与歧义性问题。另一方面,实际应用中的短文本含有大量的无标记数据,而人工标注这些无标记数据耗时且繁琐,使得短文本分类任务面临着巨大挑战。为此,本文分别针对标记数据与无标记数据开展了监督和半监督的短文本分类方法研究,其
学位
伴随着互联网技术的快速发展,网络购物已经逐渐成为了人们生活中不可或缺的一部分,国内网上购物平台的兴起也进一步导致中文商品评论文本数据的大量产生,这些评论文本数据中往往包含着大量的情感信息,因此如何分析应用这些信息无论对于企业、个人还是国家都有着重要的研究意义。本文在首先介绍了中文商品评论情感分析的研究背景和意义、国内外研究现状和相关的理论基础知识后,着重研究中文商品评论的情感分析。本文的主要研究工
学位
随着物联网技术的飞速发展,出现了大量的物联网异构设备的共存问题,也产生了不同协议的无线设备之间互相通信的需求。传统的方法是利用物联网网关,物联网网关配备了多个无线接口,为不同技术进行协议转换,实现异构物联网设备之间的间接连接。然而,物联网网关需要接收和发送不同的信号,引入了额外的硬件成本和信道资源占用。因此,研究者提出了跨协议通信技术(CrossTechnology Communication,C
学位
旋转设备故障诊断是保证设备可靠运行的重要研究内容,轴承复合故障诊断由于其特征高度耦合,故障类型繁多,是故障诊断中的难点问题。现有的复合故障诊断方法多需要获取大量的复合故障样本进行信号分析或者模式识别,考虑到实际工况中,轴承的单一故障样本比较容易采集和标注,但复合故障的样本却难以获取且难以标注。本文从单一故障样本与标签的约束条件入手,研究复合故障样本识别的新方法,提出基于零样本嵌入模型的复合故障诊断
学位
骨龄评估(Bone Age Assessment,BAA)作为儿童健康成长的重要组成部分,可以直接反映出儿童的生长发育情况,得到了人们的广泛关注。儿童骨骼的生长发育过程是连续的、阶段的,并具有具有一定的规律性。因此,专家可以利用手部X光片判断出儿童骨骼的生长发育情况,并对遗传性和内分泌疾病进行相关诊断。此外,骨龄评估还可以用于特殊人才的选拔和作为罪行推定的依据,在体育、法律等领域也发挥着重要的作用
学位