语音识别系统对抗样本防御方法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:raymond20082002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习技术已经在很多领域得到了广泛应用。与此同时,深度学习的安全性问题也随之而来,尤其是对抗样本问题。研究表明,目前大多数的深度学习模型容易遭受对抗样本的攻击。攻击者可以通过向正常样本添加细微的扰动,来生成高伪装性的对抗样本。深度学习技术的使用使语音识别技术更加高效与准确,帮助语音识别系统更好的理解用户,使语音识别技术真正走向了实用化。但对抗样本攻击的安全性问题,在目前主流的语音识别系统中仍然存在。一段人耳听起来正常的语音,可能由于对抗样本的攻击而被语音识别系统识别成一段恶意的指令。已有的针对语音识别系统对抗样本的防御方法效率较低、通用性差以及计算成本较高。因此,如何简洁、有效以及快速地防御语音对抗样本是提高语音识别系统安全性的关键。本学位论文主要研究语音识别系统的对抗样本防御技术,提高语音识别系统的安全性与鲁棒性。在保证正常样本识别准确率的条件下,应尽可能降低对抗样本的攻击成功率,提高防御效率。基于以上目标,本文提出了三种高效的语音对抗样本对抗样本防御方法:(一)基于随机噪声的语音对抗样本防御算法。我们通过大量实验发现,在添加合适强度的随机噪声到对抗样本后,对抗样本的扰动将变为原始扰动和随机噪声的叠加。原始扰动由于受到随机噪声的影响将被破坏失去其特殊性,同时对抗样本也将失去攻击效果。实验结果表明,该方法可有效地防御两种语音识别系统的对抗样本,且防御效果优于其他方法。对于文本式语音识别系统,对抗样本防御前后相似度最低可降到0%,完全失去攻击效果。对于命令式语音识别系统,在保证正常样本识别准确率高于90%的前提下,对抗样本平均攻击成功率最低可降到2.13%。(二)基于帧偏移的语音对抗样本方法算法。采用添加随机噪声来防御对抗样本的方法,一定程度上会影响正常样本的识别结果,且所加噪声的合适强度与对抗样本的扰动强度有关。因此我们进一步考虑对正常样本影响更小,且不用考虑对抗样本的扰动强度的方法。本学位论文通过研究语音识别系统的原理,发现帧偏移可以让对抗样本的识别结果发生改变,同时正常样本的识别结果可以保持很小的改变。我们通过理论分析,最终确定了可达到最好防御效果的最佳帧偏移量。实验结果表明,该方法相对于其他方法对正常样本的影响更小。对于文本式语音识别系统,正常样本相似度达到95%左右。对于命令式语音识别系统,其正常样本识别准确率为94%,变化小于1%。(三)基于变速变调的语音对抗样本防御算法。使用帧偏移来防御对抗样本的方法对正常样本影响较小,且方法不用考虑对抗样本的扰动强度,但是该方法对对抗样本的防御效果不如随机噪声。因此我们进一步考虑对正常样本影响小,且对对抗样本影响大的方法。我们通过大量实验发现,通过让语音对抗样本的语速和语调进行微小的调节,可以让语音对抗样本的识别结果发生改变。对于正常样本,改变其语速和语调,其识别结果改变很小。对于对抗样本,其识别结果会有很大改变。通过实验,确定了达到最好防御效果的合适的变速变调参数。对于文本式语音识别系统,该方法的正常样本的相似度达97.05%,对抗样本相似度最低可降到0%,效果优于其他方法。对于命令式语音识别系统,其正常样本识别准确率为95%。
其他文献
化学是一门重视实践的学科,而化学实验是高校化学教学的重要组成部分,化学药品的安全有序管理是化学实验得以顺利进行的保障。随着化工行业的发展和高校教育人群的增加,实验室中化学药品使用量逐年增多,而且实验室存放的化学药品种类繁多、性质复杂,传统的管理方式一方面难以满足师生日常使用需求,另一方面缺乏安全管理条件。论文针对高校实验室化学药品管理需求,设计一种新的化学药品管理系统,系统采用了RFID、指静脉识
学位
目前,光伏发电作为一种主要的绿色能源利用方式,已经被日益广泛使用。但光伏发电的使用也对用户和电网造成了不利影响。光伏大规模并网会导致电网中传统发电方式所占比例降低,因此当发生紧急情况时,电网的应对能力较差。光伏发电的波动性还会影响母线的功率平衡,造成电能质量的下降。因此,精确的光伏预测对光伏电站与电网的安全稳定运行十分重要。此外,对用户和电网而言,在对光伏发电功率进行精确预测时,若能够结合储能设备
学位
随着集成电路的发展,芯片越来越接近工艺制造的极限,面对大数据量传输的需求的增加,以光为传输载体的光互连技术开始崭露头角,因其具有高速传输速率以及抗电磁干扰等优良特性,可突破电互连在带宽、功耗等方面的瓶颈。光逻辑器件是光互连中实现高速、大容量光信号处理的基础元件。其中,可逆逻辑器件因将输入与输出一一对应,能解决不可逆逻辑中因信号位丢失而引起的散热问题而备受关注。硅基光子技术可兼容现有互补金属氧化物半
学位
温度是生物研究中重要的指标,准确监测细胞在自然代谢过程中或药物刺激情况下的温度波动具有重要意义,能够为更深入的研究细胞在不同状态时的能量产生和扩散提供有意义的信息,对癌症和其他疾病的研究有一定帮助。采用荧光聚合物和热电偶探针等方法进行细胞温度测量存在测量精度低、细胞状态被干扰的局限性。本文研制的微芯片可用于监测微环境下的细胞温度波动,该微芯片由具有捕获功能的细胞培养结构和用于监测细胞温度波动的高精
学位
机械臂广泛应用于工业生产和社会生活的各个领域,传统的机械臂控制方法依赖于精准的环境模型,难以适应复杂的、未知的非结构化环境。近年来,随着人工智能技术的发展,结合深度强化学习的机器人控制技术有了长足的进步。深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)算法作为深度强化学习的经典算法,适用于连续控制问题,广泛应用于机械臂控制研究,但由于DDPG
学位
随着攻击技术不断发展,防御信息存储与传输所面临的各种威胁成为当今安全芯片领域的研究热点。物理不可克隆函数(Physical Unclonable Function,PUF)利用器件制造过程中固有的工艺偏差产生具有随机性与唯一性的数字指纹。攻击者难以通过常规攻击方式破解、克隆其中加密数据,可极大提高芯片的安全性。随着物联网技术不断更新,器件集成度不断提高,设备对能耗要求越来越高,极大限制PUF电路的
学位
面积和功耗限制了芯片性能的进一步提升,底层硬件的运算能力也不能满足日益增长的计算需求。与此同时诸多容错应用,如多媒体处理、数据挖掘和图像识别,也被越来越广泛的使用。在这样的背景下,人们提出了新的设计范式——近似计算。近似计算牺牲精度来换取电路性能的提升,可以为容错应用设计高效节能的系统。近似计算是指计算结果与正确结果之间存在偏差。近似计算技术应用到逻辑级优化电路的核心思想是人为引入一些错误输出来简
学位
随着人工智能时代的来临,对于芯片算力和功耗的要求日益提高。目前单片的晶体管密度已经达到0.9亿/mm~2,例如,英特尔基于IVY Bridge的四核芯片大约有十二亿个晶体管。设计这样异常庞大且复杂的电路无法依靠人力实现,必须使用自动化方式。电子设计自动化(EDA)是进行芯片设计所必不可少的工具,而标准单元库是使用EDA工具进行芯片设计的核心。当下主流的集成电路采用FinFET器件,目前FinFET
学位
随着“制造强国”战略的提出以及5G技术的广泛应用,与之相关的物联网技术得到了快速发展。然而,由于受到了电池寿命及更换电池困难等因素的影响,如何实现物联网各类传感节点的自供电已逐渐成为工业界和学术界广泛关注的热点话题。事实上,日常环境中存在丰富的射频能量信号源,大部分射频能量的发射具有全向性和全时段特性,会造成大量能量的浪费。因此,本文设计了一种基于射频能量收集的低功耗传感节点,可为传感节点的自供电
学位
SLAM(Simultaneous Localization And Mapping),即同步定位与地图构建,是机器人在一个完全未知的环境中解决定位、地图构建和导航的关键技术。SLAM系统通常由视觉里程计、闭环检测、后端非线性优化和地图构建等环节组成,其中闭环检测部分通过判断图像之间的相似性来解决位姿估计随时间的漂移问题,在SLAM系统中起到了重要的作用。传统的闭环检测方法大多采用人工设计的图像特
学位