文本对抗样本攻击与防御关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:kensenwey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几十年里,人工智能相关领域得到了广泛的发展,如计算机视觉、自然语言处理等。然而,有一些技术被证明是脆弱的,一些被篡改过的输入,人类可以很容易地区分,但算法会将其分类错误,这种被篡改过的输入称为对抗样本。如何生成高质量、不易察觉的的对抗样本和如何有效防御这种对抗样本成为近年来的研究热点。本文从攻击和防御两个方面对对抗样本问题进行了深入研究。针对了解模型架构和参数等信息的攻击,本文提出一种基于梯度的白盒攻击方法来攻击情感分类器。一方面,在扰动文本时使用欧式距离和余弦距离组合度量选择语义上最相似的替代单词,扩大了候选词范围,可以有效地提高攻击成功率。实验结果显示该方法将全局搜索攻击成功率从75.8%提高到85.8%。另一方面,为了防止像贪心搜索算法生成的对抗样本中替换词容易聚集在一起,从而使文本可读性很差。本文引入变异系数来控制对抗样本中修改词位置的分散性,分散的修改内容可以增加人类对修改的不感知性和文本可读性。在评估部分使用攻击成功率来验证攻击方法的有效性,并使用最终替换词的变异系数值来衡量所生成的对抗样本中修改词的离散程度。最后将这两种方法结合使用,可以提高攻击成功率并使生成的对抗样本中的单词修改位置更加分散。针对不了解模型内部信息时的攻击,本文提出了一种新颖的黑盒攻击方法,该方法基于差分进化算法来生成在语义和语法上相似的对抗样本,生成对抗样本同样用来欺骗词级情感分类器。与现有的基于遗传算法的对抗攻击相比,本文的算法在保持较低的单词替换率的同时,可以获得较高的攻击成功率。在10%的单词替换阈值下,本文将攻击成功率从58.5%提高到63%。攻击者可以使用这两种攻击方法来应对不同的应用场景。针对对抗样本的防御,本文提出了一种称为鲁棒对抗训练RAT的防御方法。该方法首先按照对抗训练的思想加入一些对抗样本到训练集中一起训练,在训练过程中,再按一定比例对训练集中的文本做扰动,以此来学习对抗样本中可能出现的特征。在两个数据集上的实验表明,基于RAT框架的模型可以有效防御词级对抗攻击。与现有的防御方法相比,RAT框架下训练的模型在1000个对抗样本中具有更高的防御成功率。另外,RAT训练后的模型在标准测试集上的准确性也优于现有的防御方法,并且其准确性非常接近甚至高于标准模型。
其他文献
卫星气象水文数据广播应用系统是利用卫星数据广播技术,广播、接收、处理和应用气象水文信息的综合业务系统,该系统是气象水文自动化系统的重要组成部分。该系统目前存在以下两个急需解决的问题:一是接收终端采用计算机+接收卡的配置模式,体积大、便携性差;二是由于卫星信道不稳定,导致信息容易丢失。本文针对上述两个问题,综合开展嵌入式卫星气象水文数据广播接收终端系统研究,初步设计实现了基于嵌入式技术的便携式卫星气
学位
多旋翼无人机凭借其无人化、智能化和高隐蔽性在未来战场中占据重要地位。多旋翼无人机的隐蔽性直接影响监视和侦察任务执行的成败。为了提高多旋翼无人机的隐蔽性,需要进行降噪技术研究。在多旋翼无人机飞行过程中,旋翼高速运转,与空气紧密接触并产生剧烈的摩擦,是气动噪声的主要来源。现有的多旋翼无人机降噪技术主要从材料选型、转速调节和翼形优化等方面进行研究。近年来,随着仿生学的兴起和快速发展,为多旋翼无人机降噪提
学位
在当今战场上,战机稍纵即逝,履带车辆的牵引特性决定了其快速机动的能力,在一些地形条件恶劣或地质松软不利于通过的地带,尤其在沙漠、戈壁、海滩等砂壤地面作战条件下,对车辆的牵引特性提出了更高的要求,如何预测评估履带车辆的牵引特性一直是一个复杂的难题,目前预测履带车辆牵引特性理论和仿真的研究主要是针对直线工况,且缺乏必要的预测精度。本文为提升履带车辆牵引特性相关理论和仿真的工况完备性和准确性,提出了一种
学位
食品功能因子如姜黄素、白藜芦醇等可用于食品中营养素的强化以增强其功能。然而,这些疏水性功能成分水溶性差、化学不稳定及生物利用率低,很难被直接添加到膳食补充剂和功能性食品中。根据研究报道,利用蛋白质和多糖构建的乳液基递送载体对功能因子进行包埋和递送可有效提高其水溶性及生物利用率。本论文以乳铁蛋白(LF)和透明质酸(HA)为壁材,围绕蛋白质与多糖在油-水界面的相互作用展开,探索不同乳液微结构与姜黄素和
学位
增塑剂作为最重要的塑料助剂之一,为材料提供优异的加工性能和多样的材料特性,在塑料中被广泛应用。传统增塑剂邻苯二甲酸酯类增塑剂是使用最广泛、用量最大的增塑剂。随着对其研究的深入,其对人体潜在的危害也逐渐显现,且邻苯类增塑剂的生产需要消耗大量不可再生的石油原料。因此,许多国家颁布了多项相关法律法规和使用标准,限制了邻苯增塑剂的使用。为了填补传统增塑剂的空缺,开发环保及可再生增塑剂成为未来研究的发展趋势
学位
的一个非常具有挑战性的子任务。其抽取式方法主要从源文本中获取关键语句来组成摘要,生成式方法主要通过神经网络理解编码源文本,然后通过文本语义来预测生成摘要。科技文献抽取式摘要的计算过程简洁,且获取的语句信息准确可靠,但抽取语句组成的摘要通常包含不必要的冗余成分;与之相对地,生成式方法主要通过编码器-解码器框架来生成摘要,训练好的模型可以生成比较简洁流畅的语句,但是神经网络模型不能很好地在写摘要之前深
学位
武器对各类重要工程目标的精确打击以及爆炸恐怖袭击使得建筑结构遭受炸药接触或近区爆炸作用概率日益增加,此外,工业生活偶然爆炸事故也对钢筋混凝土结构建筑物的安全带来威胁。接触或近区爆炸冲击波压力高、破坏力强,容易造成结构严重的局部毁伤,导致构件承载力大幅下降甚至建筑物连续倒塌。因此,钢筋混凝土建筑结构的抗爆防护能力极其重要。本文以典型工程尺度钢筋混凝土梁为研究对象,采用试验研究与数值模拟相结合的方法,
学位
目的:观察“通督调神”针法联合火针治疗中风后偏瘫的临床疗效。方法:选取2021年12月—2022年7月在安徽中医药大学第二附属医院老年病四科住院治疗的中风后偏瘫病人40例,随机分为对照组和治疗组各20例。两组均给予一般西医药物治疗,对照组给予“通督调神”针刺方法治疗,治疗组给予“通督调神”与火针相结合的针刺方法进行治疗。比较两组治疗前后美国国立卫生研究院卒中量表(NIHSS)、Fugl-Meyer
期刊
研究钢筋混凝土柱(RC柱)在爆炸作用下的动态响应与破坏模式对分析整体结构抗连续倒塌性能至关重要。为此,本文开展接触爆炸荷载作用下钢筋混凝土柱毁伤试验研究,采用数值模拟方法进行参数分析,并对不同拆柱工况下钢筋混凝土框架结构抗连续倒塌性能进行对比研究,本文研究主要成果如下:(1)以混凝土强度、轴压比、柱端箍筋密度、TNT炸药当量为参数,设计制作了13个试件柱,并开展爆炸试验。试验结果表明,RC柱在端部
学位
由于软件开发的复杂性,缺陷是不可避免的。对于大规模软件而言,由于其代码量庞大,在软件开发和维护过程中,验证代码正确性、以及进行缺陷定位、修复等活动往往存在较大难度。为保证软件质量,许多软件项目在软件缺陷管理系统中使用缺陷报告来收集、记录开发者、测试者和用户报告的软件缺陷。实际上,随着软件的发展,尤其是开源软件的快速发展,每天都在产生大量的缺陷报告。本文以开源操作系统缺陷报告以及缺陷所在软件包为研究
学位