基于深度学习的文本填充算法研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:zjbme2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本填充也叫缺失文本生成,主要任务是填充文本中缺失片段的信息,是自然语言处理一个研究领域。近几年,随着深度学习的快速发展,文本填充任务取得了一定的成果。但仍然存在一些问题,例如填充文本缺失部分信息与上下文语义信息不一致,使得填充后的文本连贯性和流畅性较差。填充文本缺失部分信息存在多样性和复杂性,以及考虑语法、句法和上下文语义信息等问题,使得填充任务变得更加艰巨。针对上述存在的一些问题,本文进行了基于深度学习的文本填充算法研究。首先,对文本语义相似度工作进行了相关研究,语义是自然语言处理最核心的问题,为解决语义相似度匹配任务中信息交互不充分和语义特征损失的问题,提出了一种基于密集连接网络与多维特征融合的语义相似匹配方法。其次,在研究语义的基础上,针对文本填充过程中存在语义损失导致填充后的文本语义连贯性较差的问题,提出了一种基于预测网络与语义相似度融合损失的文本填充方法,通过交叉熵与相似度融合减小语义损失。最后,将本文提出的模型与其他模型在各种实际数据中进行测试对比,实验结果显示本文提出方法效果优于其他模型。本文的主要贡献有:1、提出了一种基于密集连接网络与多维特征融合的语义相似度文本匹配方法,使用密集连接方式可以将最底层的词嵌入特征和最高层的密集模块特征紧密连接,丰富了句子的语义特征。其次,设计了多维特征融合方式,使得模型能捕获到句子对间更多的语义信息。通过和其他文本语义匹配算法进行测试对比,模型在三个不同的任务,即自然语言推理SNLI和Sci Tail,释义识别Quora,以及蚂蚁金融四个基准数据集上进行了评估,准确率分别提高了0.3%、0.3%、0.6%和1.81%,表明本文提出的方法性能均优于其他强基线模型:(1)与传统残差连接网络方式不同,使用密集连接网络,可以将多个密集模块输出特征与原始特征(词嵌入特征)紧密连接,丰富了句子的语义特征。(2)使用多维特征融合,在基于注意力机制词级交互的基础上,将句子对间的相似性特征、差异性特征和关键性特征进行多维特征融合,使模型能够捕获到句子对间更多的语义关系。2、提出了一种基于预测网络与语义相似度融合损失的文本填充方法。预测网络采用序列到序列的神经网络模型,通过交叉熵与相似度融合减小语义损失。首先,编码端对缺失文本进行编码,得到上下文语义特征。其次,解码端使用Transformer网络对缺失文本进行填充。最后,融合了语义相似度损失,使得填充后的文本语义更加连贯和流畅。通过和其他填充方法进行测试对比,在Yelp、Grimm和NBA新闻数据集上使用不同的缺失率和屏蔽策略进行了评估,准确性和流畅性有了显著的提升。表明本文提出的方法在文本填充任务中效果明显优于其他方法:(1)预测网络由编解码两部分组成,分别为Bi-LSTM网络和Transformer网络。通过预测网络可以实现对缺失文本进行填充,在解码端Transformer网络中,多头注意力机制在文本填充过程中,可以捕获文本缺失片段的上下文语义。(2)在原交叉损失熵的基础上融合了语义相似度损失。两个损失学习到不同的语义特征,交叉熵损失学习局部的语义特征,而相似度损失学习到文本的全局语义特征,最后将两个损失加权融合作为网络的损失函数。
其他文献
信息技术和互联网行业的发展正逐步改变着人们的生活方式,各大平台纷纷推出智能解决方案,因此衍生出来的数据庞大且丰富,其中图数据在应用中非常广泛,如知识图谱,社交网络等,但这些图数据通常结构复杂,规模庞大,对用户的信息获取形成了挑战,传统的推荐算法虽然能缓解上述困难,但其不能有效的处理图数据信息,不能很好的捕获用户的个性化偏好,且会导致数据稀疏和冷启动问题。针对以上问题,本文采用基于图表示学习的个性化
随着互联网普及率的增加和网民规模的扩大,网络应用的种类和流量与日俱增,导致网络效率降低、带宽消耗加剧、用户体验变差。在这种情况下,如何有效的缓解网络数据拥塞是提升网络性能的重点。大象流作为影响网络性能的主要数据流量类型,数据量大,链路带宽消耗高,对大象流进行分析建模以便及时侦测是当前计算机网络和本研究的重点。当前大多数的数据中心采用基于阈值的简单模型描述大象流,进而实现大象流的侦测;一些大象流侦测
随着《中国制造2025》全面推进,三维立体视觉技术作为计算机视觉中最核心技术之一,在智能制造应用中扮演者重要的角色。例如利用三维立体成像技术实现快速、高精度和数字化在线测量,引导机器人实现智能抓取和操作。结构光投影轮廓测量技术是三维立体成像技术的重要研究方向之一。在工业生产过程中,三维重建技术会把物体的表面每一点三维坐标数字化、点云化,就能够在三维立体空间中引导机器人抓取、测量等。本文从环境中噪声
网络规模增加,接入设备多样化增加了网络管理的复杂性。传统的网络设备耦合了控制和转发功能,但由于品牌和种类的多样化,缺乏统一、开放的管理接口,维护网络全局视图的成本高,实现网络性能的全局管理和资源优化难度大。软件定义网络(Software Defined Network,SDN)通过分层的网络架构、集中控制、标准化开放接口实现了控制和转发功能的解耦,降低了网络全局视图维护的成本,解决了传统网络在性能
光刻机是制造集成电路的核心设备,随着集成电路向先进制程不断发展,集成电路制造业对光刻机套刻精度要求越来越高。运动台定位精度、重复性决定了光刻机的套刻精度,目前对运动台定位测量的工具只有激光干涉仪和光栅尺两种,光栅尺环境鲁棒性相对较好。现阶段我国对光栅尺相位信号处理系统研究较为匮乏,尤其缺乏能够应用于28 nm浸没式光刻机的高分辨力光栅尺相位信号处理技术和设备。本文针对光栅尺相位信号的第一类非线性误
自1986年由A.Ashkin等人首次完成光镊实验以来,光镊技术已广泛应用于生物学、化学、胶体科学和物理学等领域。特别是在生物学中,它被应用于操纵细胞、细胞器、病毒、细菌和DNA分子,为研究这些基本生命单位和了解其生物学功能提供了有力的工具。光纤光镊继承了光纤灵活、体积小、结构紧凑的优点,可以通过人体的天然孔口到达病变组织,从而非常好的应用于体内医疗。在光纤光镊的研究中,提高可操作性以实现多维度操
近年来,随着先进的科学和技术的迅猛发展和智能家居设备的日渐普及,智能电视逐渐成为家庭物联网的控制中枢。然而在日常使用中,传统的遥控器操控具有一定的依赖性和局限性。手势作为一种非常契合人们在日常生活中各种交流习惯的一种人机交互方式具有自然、舒适等特点,相较于借助穿戴设备,通过摄像机进行手势操作更加符合人们的日常使用需求,因此基于视觉的动态手势识别的人机交互系统对于智能电视具有很高的研究价值。目前,基
高脂血症是导致多种心脑血管类型疾病的重要诱因且存在很多因此产生的并发症,由于其隐匿性导致多数疾病并无典型症状,极易耽误最有效的防治时间,对人们身体的生理机能产生了巨大的危害。其中,胆固醇浓度过高表现为高胆固醇血症,进而导致血脂水平整体异常。因此,胆固醇浓度值是检测高脂血症很重要的指标。目前常用的血脂检测方法多为医院生化检测测得,不仅给被测对象造成疼痛的感觉,而且还增加了针刺部位的感染风险,且实时性
微纳结构往往赋予材料/器件独特的力学、物理及化学性能,其在光学领域的研究可以分为运用光学原理对器件表面的微纳结构实现非接触无损检测以及研究微纳结构在如何影响器件的光学性能两方面。对于微纳结构的非接触光学表征包括粗糙度检测以及纹理方向检测,通过结合纵向的粗糙度信息以及横向的纹理信息即可以实现对微纳结构的三维表征。基于光学的非接触式粗糙度检测方法包括白光干涉法、共聚焦显微镜测量法、散射法等。由于散射法
随着互联网的快速发展,信息的爆炸式增长,文本信息是人们获取信息的主要来源,近年来自然语言处理技术受到越来越多研究者的重视,自动生成文本摘要技术是该技术的一个重要研究分支。本文针对自动生成文本摘要技术进行研究,并将句子语义相似度匹配技术和摘要评价技术作为摘要技术的支持性研究。首先通过改进传统注意力机制和损失函数,提出了一个基于语义相似注意力机制的摘要模型,将原文与生成摘要两者的语义特征向量余弦相似距