压缩深度神经网络模型应用场景下安全及隐私保护研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:aaa3cbbfm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习(DL)在许多领域都取得了显著成果。深度神经网络(DNNs)的最新进展促使现代人工智能(AI)应用取得重大突破。基于DNN的模型广泛应用在计算机视觉、语音识别、人脸识别和自然语言处理等领域。由于模型包含大量的参数,对计算能力和存储空间有较高需求,从而模型在许多现实场景中不易部署,因此模型压缩是解决部署难题的有效方法。但是,压缩DNNs在深度学习管道系统中面临机密性攻击、完整性攻击和可用性攻击即CIA攻击,在训练阶段和推理阶段威胁模型安全及数据隐私。针对这些威胁,本文针对卷积神经网络(CNNs)展开研究,提出隐私深度学习方法和模型鲁棒机制,保护数据的隐私和提高模型的鲁棒性能。论文内容和主要贡献总结如下:针对模型泄露数据隐私的问题,设计基于隐私的压缩CNN模型的服务提供系统。在系统中,云服务器将大规模的预训练模型压缩为小规模的压缩模型,将压缩模型部署到边缘服务器,边缘服务器为邻近物联网设备提供优质的服务。为了保护训练数据的隐私,需要保证压缩模型和预训练模型的机密性。这是因为:一方面敌手可以通过压缩模型提取训练数据的隐私信息;另一方面压缩模型是由预训练模型通过裁剪得到的,压缩模型的权重分布也会暴露预训练模型的权重分布,从而敌手可通过预训练模型推测数据隐私。为了解决以上问题,引入差分隐私机制,提出一种基于差分隐私的压缩CNN模型的生成方案。压缩模型主要通过隐私预训练和隐私压缩训练两个步骤构成。在这两个步骤中分别使用差分隐私来保证训练数据的隐私。针对MNIST数据集和CIFAR-10数据集进行一系列实验,结果表明压缩模型能够同时兼顾高隐私性和高可用性。针对DNNs容易遭受对抗样本攻击的脆弱性,研究提高DNN模型抵御依赖于模型梯度生成的这类对抗样本的鲁棒性能,设计基于鲁棒的压缩CNN模型的系统架构。由于移动设备的计算能力有限,模型分割部署在移动设备和边缘服务器,移动设备和边缘服务器协同训练模型。为了增强压缩模型的鲁棒性,提出协同训练生成鲁棒的压缩CNN模型机制。为了保证压缩模型较高的测试准确率,向模型添加Laplace噪声时,考虑模型压缩后的权重分布,提出基于模型权重分布的防御机制。生成的压缩模型可作为移动设备和边缘服务器协同推理模型为邻近移动设备提供识别服务。同时,压缩模型适合部署在移动设备上。压缩后的模型可以保持高的鲁棒性和高的可用性。针对快速梯度标记法(FGSM)和基本迭代法(BIM)攻击,通过训练MNIST数据集评估模型的性能。通过与无防御机制的模型比较,实验结果表明生成的鲁棒的压缩模型抵御对抗样本更加有效。模型的性能取决于训练数据集的规模。然而,单个机构的训练数据数量有限。这两个原因驱动多方机构通过分布式深度学习训练方式,提高模型的可用性。但是,如果数据直接发送给第三方或者通过各方之间共享数据的方式训练模型,会泄露各方数据集的隐私。而且,模型一旦生成,会遭受对抗样本的攻击。因此,设计了MMD-ED系统,提出基于分布式隐私深度学习生成鲁棒的压缩模型机制,边缘服务器协助多个移动设备训练得到本地鲁棒的压缩模型,模型部署在移动设备和边缘服务器之间。每个移动设备首先训练一部分模型,边缘服务器学习另一部分模型。为了保护任一方移动设备的训数据集的隐私不被其它方移动设备推测出,安全多方计算(MPC)应用在深度学习中,提出分布式隐私深度学习机制,多个移动设备利用秘密共享计算中间结果的平均值并将其发送给边缘服务器。为了提高模型针对对抗攻击的鲁棒性,引入鲁棒机制。此外,由于向模型中加入Laplace噪声,对训练数据集起到隐私保护的作用。边缘服务器将模型压缩后发送给移动设备,各移动设备最终得到本地鲁棒的压缩模型。
其他文献
黄土高原是我国水土流失严重的地区之一,其重力侵蚀又是水土流失的重要策源,尤其是在黄土丘陵沟壑区和塬边区域,土坎、陡坡密集,重力侵蚀严重,侵蚀强度较大。目前防控土坎、陡坡滑塌已成为治理水土流失的重要措施。论文以永寿县、长武县、西峰区的土坎植物群落为研究对象,通过系统的野外样地调查,分析了土坎植物群落的组成结构、群落类型、物种多样性、优势种种间关系以及生态位特征,阐明了不同群落类型物种多样性的差异及对
δ-生育三烯酚(δ-tocotrienol)是维生素E的重要组成成分,然而在关于维生素E的研究中大部分是研究生育酚,尤其是α-生育酚,然而最近研究表明δ-生育三烯酚(δ-tocotrienol)在抗炎
我争取组织入党的过程有11年时间,而争取思想入党的过程似乎至今也没有完成。我是在高中二年级写的入党申请书,那时我充满了革命激情,虔诚地信仰马列主义,严格地要求自己,但
在人工智能蓬勃发展的今天,深度学习被普遍应用于社会生活的各个方面。空气质量的影响因素有很多,比如会受到风向、风速、气温、湿度和污染源排放情况等影响,所以,对空气质量
作为双子叶植物中种类最多的一个科,菊科植物是我国热带、亚热带地区最重要的绿肥资源之一,为了探明我国菊科绿肥的肥用价值,本文分析了39份采于海南、广西、广东、福建、云
“营改增”是一项深化我国财税体制改革的重要决策。营业税的征收由于重复计税,不益于社会和企业的发展,加重了企业的负担。为改变这一现状,实现国家的结构性减税,“营改增”成为我国的必然选择。自国家推广“营改增”以来,“营改增”的研究逐渐成为主流。学者们针对“营改增”政策对建筑业影响的研究成果也逐渐丰富,但关于“营改增”对建筑业税负和业绩的影响的研究结论尚未达成一致。本论文以建筑业上市公司为研究主体,明确
深度学习凭借强大的数据分析和处理能力在计算机视觉、自然语言处理等领域得到广泛应用。但是,深度学习模型的训练往往需要大量数据,故难以应用于数据收集受限的场景,例如医院、银行等。分布式深度学习系统中的训练数据存储在用户本地,该系统由多个训练用户和一个参数服务器组成,每个训练用户利用本地数据集训练一个深度学习模型,并通过参数服务器共享模型参数进而提升学习效果。虽然分布式深度学习中的模型训练在用户本地完成
建筑业作为国民经济重要行业之一,为扩大内需、解决就业问题、增加税收提供了一定的保障。平潭综合实验区享有“隧道之乡”的盛名,隧道业是平潭的特色优势产业,如今,在政策号召和市场需求吸引下,平潭建筑产业发展态势良好。但是,由于税收征管力量不足、税负上升引起纳税人的抵触情绪、建筑业本身业态复杂以及政府有关部门信息共享不完整等原因,平潭建筑业的税收征管不到位和纳税人偷税漏税现象时有发生,面对税收征管与行业发
2016年5月1日,我国“营改增”工作全面推开,包括建筑业在内的多个行业被纳入“营改增”试点范围,我国由此开启了新一轮的税收征管体制改革。“营改增”三年来,虽然建筑业发展势头良好,税收贡献逐年增加,但由于建筑业相关政策、征管机制的不足和缺陷,以及建筑业纳税人纳税遵从度的问题,税务部门在对其征管过程中仍存在一些问题。这些征管问题严重阻碍了税收征管效率的提高,也不利于我国优化、高效、统一税收征管体系的
自由是人类的永恒理想与普遍追求,黑格尔关于自由的思考构成人类自由理论的重要一支。由于黑格尔哲学的体系性质与文本特征,国内外学界关于黑格尔自由思想的大量研究一方面具