基于预训练语言模型和层级相关性传递的对抗文本生成技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:wangya110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对抗样本能够显示出深度神经网络(DNN)的固有漏洞,这些攻击性的样本是攻击者在真实样本的基础上恶意制作的,旨在使目标DNN行为异常。对抗性样本的威胁广泛存在于图像,语音以及文本识别和分类中。对抗样本的生成对具有“黑盒”属性的深度神经网络可解释性的研究和基于深度神经网络的安防领域有着极大的促进作用。在文本领域,生成的对抗样本通常有攻击成功率,语义保持,语句流畅性以及添加的扰动大小等方面的考量。当前对抗文本的生成方法通常关注于添加扰动的大小以及攻击成功率的高低,而很难满足保持原始文本的语义和生成的对抗样本能够保持较好的语句流畅性。同时,当前的对抗文本的生成方法大多是基于英文的场景,并没有充分考虑到中文汉字的特点并进行针对性地处理。针对以上问题,本文结合当前性能强大的预训练语言模型和中文汉字的特点提出了基于预训练语言模型的对抗样本的生成方法,结合可解释性研究领域数据相关性的研究理论提出了基于层级相关性传递的对抗文本的生成方法。主要贡献如下:1)本文提出了 一种基于预训练语言模型的对抗文本的生成方法,利用预训练语言模型中的掩码语言模型将对抗样本候选词的生成过程当成一个完形填空的问题。使用掩码语言模型能够保证生成的候选词符合原始文本的上下文语境,即保证其语义的完整和语句的流畅性。同时结合中文汉字的特点,如字形,字音等,生成的对抗文本能够更好的保持原始语义。2)本文提出了 一种基于层级相关性传递的对抗文本的生成方法,引入基于层级相关性传递的文本重要性计算的方法,并利用其重要性计算的结果,引导对抗文本的生成过程。本文将利用这种相关性的大小,确定当前状态输入文本对结果的影响力,即重要程度,来进行后续的对抗文本生成,提高生成对抗文本的质量。为了验证提出的两种算法的效果,本文在领域内常用的公开中文数据集上进行了大量的实验和相应的分析工作。通过这些实验可以表明本文提出的两种算法均能够有效的提高对抗文本的攻击成功率,同时显著地提高了生成对抗样本的质量。此外,本文提出的方法参加了 2019年DIAC(基于Adversarial Attack的问题等价性判别比赛),并达到了 DIAC最终成绩排行榜的top2.5%,验证了其有效性。
其他文献
三磷酸腺苷结合盒式转运蛋白(ATP binding cassette, ABC)是目前发现的最大的膜蛋白家族之一,广泛分布于从细菌到人类等各种生物体中,每个成员都含有两个高度保守的ATP结合区(ATP binding cassette),可通过结合ATP发生二聚化水解释放能量,并形成一个跨膜通道从而实现多种底物的跨膜转运。可转运的底物包括:无机离子无机酸、氨基酸、脂类、糖类、多肽、各类药物、细胞代
人脸识别技术在当前已经得到广泛应用,在一些限定场景下已较为成熟。然而,该技术仍然存在一些缺陷,主要表现为目前大部分人脸识别产品对姿态有着较高的要求,需要用户配合主动调整自身姿态至正面才能获得较好的识别效果,这极大限制了该技术在更大应用场景进行推广。因此,多视角人脸识别技术在许多非用户配合的应用场景具有重要意义。针对上述问题,本文展开了多视角人脸识别技术的探索,研究并实现了一种基于三维可形变模型的人
目前,大屏幕拼接器已经广泛应用于各种场景,如展览、新闻、车站、交通及军事指挥等。本文分析了国内外大屏幕拼接器的目前状况、应用场景以及发展趋势,并根据当前大屏幕拼接器的性能问题,确立了本论文的主要研究内容。在大屏拼接器的视频传输能力、资源使用效率等关键性能上,本文分析了拼接器业务板之间的数据传输带宽、缩放效率以及缓存带宽利用率等关键技术,提出了一种基于FPGA平台的逻辑优化设计方案。和传统的大屏拼接
自2012年Alex Net[1]结构在ILSVRC比赛中展现出绝对优势以来,卷积神经网络(Con-volutional Neural Network,CNN)成为机器学习领域备受关注的研究对象。随着在NVIDIA等公司推动研发下的计算机运算能力的不断增强,越来越多的大型卷积神经网络如VG-GNet[2],Inception[3],Res Net[4],Dense Net[5],SENet[6]凭
数据正逐渐成为现代社会的重要资源。推进数据资源的共享和开放,有助于充分发挥数据的价值。然而,在实际业务场景中,数据共享面临着隐私容易泄露、缺乏售后监管、异构数据难以适配、缺乏激励机制等问题。分析当前数据共享面临的问题,提出基于区块链和可信执行环境TEE(Trusted Execution Environment)的可信计算平台解决方案,分析平台需求并设计了数据发布、数据交易、数据跨机构使用等场景的
交通监控成像补光装置是安装在机动车道上方用于照亮监控摄像头拍摄目标的照明装置。因其安装高度低,照射方向朝向机动车辆,车辆行驶过程中驾驶人能够直接看到补光装置发光面,容易产生严重的眩光,对交通安全影响较大。近年来,LED光源在户外照明领域应用越来越广泛,交通监控补光装置也大都为以LED为光源。但由于LED接近点光源,发光面积小,亮度高,如果在配光设计时不加以控制,以LED为发光源的补光装置眩光问题相
流程工业是我国国民经济的支柱产业,其优化、管理和控制的研究依赖于仿真技术。随着近年来大数据、云计算、物联网为代表的智能制造技术兴起,企业生产呈现服务化、柔性化、绿色化趋向,生产不确定性的增大给企业生产仿真带来更为复杂的场景。场景仿真作为一种以场景来描述资源不确定性的随机性仿真,受到国内外众多制造企业、仿真研究者和仿真工具制造商的关注。但目前的场景仿真形式无法满足智能制造时代复杂多变场景配置需求和快
近些年国家号召发展海洋经济,深远海网箱养殖业得到快速发展,但发展的同时也面临着许多考验。一般,深远海网箱养殖需要面临更加恶劣的条件,养殖水产品受到多种环境因子影响,仅通过养殖海域环境某个单一因素做简单评价以及缺乏对养殖环境质量的预测分析等问题,经常导致大量经济损失。因此,本文以风门口养殖区为试验基地,对养殖环境的监测、综合评价以及环境质量预测的方法进行了深入研究,主要研究成果如下:(1)根据宁波海
TSC1/TSC2基因的突变导致哺乳动物雷帕霉素靶蛋白复合物1(mTORC1)过度活化是结节性硬化症(TSC)的重要发病原因,其中因星形胶质细胞过度增殖所致的颅内肿瘤是引起患者临床症状并导致其死亡的主要原因。已发现mTOR抑制剂能减少TSC相关肿瘤的大小,且自噬是mTOR抑制剂发挥疗效的其中一个重要机制。然而目前关于自噬对TSC相关颅内肿瘤方面的影响尚未见报道。本项目组前期研究结果发现敲除原代培养
印刷电路板(Printed Circuit Board,PCB)工作频率及其谐波频率越来越高,导致现代消费类终端电子类产品的电磁兼容(Electromagnetic Compatibility,EMC)问题严重,直接影响到产品的上市时间。为了在产品设计阶段就规避EMC风险,业界对射频元件的准确电磁建模有巨大需求。元件厂商提供的元件等效电路模型在频率和精度方面十分有限,无法满足EMC仿真建模需求。随