基于共轭搜索问题的全同态机器学习隐私保护方法

来源 :重庆交通大学 | 被引量 : 0次 | 上传用户:sherry77677
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着硬件技术的飞速发展,计算机算力日益突破,大数据和云计算逐渐成为当前最热门的技术。为充分利用数据的潜在价值,数以万计的企业正不断地收集并挖掘着人们的各种信息。随之而来的,是个人隐私被各个大公司广泛地存储起来,并不断地共享给云服务器进行深度学习、聚类分析等人工智能算法的训练。在这个过程中,怎样实现隐私数据的安全传输,怎样在发布之后进行版权维护,以及样确保数据在各处理环节不被滥用就成为了至关重要的问题。全同态加密方案能够完美地解决了上述问题。然而,由于影响人工智能算法训练精度的最大的因素是数据规模,只有充分利用足够庞大的数据集才能够训练得到符合期望分布的模型,这就带来计算效率方面的严格限制。尽管最有希望成为下一代加密标准的错误学习(Learning with error,LWE)类全同态技术被大量用于隐私机器学习方法的研究,但高昂的计算复杂度和繁琐的bootstrapping噪声控制机制使其难以满足训练效率的需求,必然导致密文数据的训练过程极为漫长。针对机器学习中数据隐私保护与处理速度之间矛盾,论文借助共轭搜索安全性假设对适用于部分人工智能算法的轻量级全同态加密方案展开了研究,内容包括:1.基于共轭搜索问题的轻量级全同态加密方案。现有全同态加密方案大多都有着过高的计算复杂度,无法有效地应用到机器学习算法中。为提高同态训练的效率,本论文构造了一种轻量级的全同态加密方案,该加密方案基于共轭搜索困难性问题,满足无条件安全性定义,因此能够有效抵御量子攻击,具有较高的安全性。同时本方案在共轭搜索问题的基础之上设计了具有特定的结构的高效同态计算加/乘算法,能够有效降低同态计算的时间开销,显著提高数据同态训练的时间效率。2.面向机器学习应用的同态计算模块。在机器学习算法中可能涉及到一些标准操作,例排序、求范数、求最大值或最小值、归一化或标准化等。此外,在训练过程中也可能会涉及到sigmoid、softmax等各种特殊的函数。考虑到这些特殊运算操作都可以通过函数近似拟合和同态比较的方法实现,因此本论文主要面向多项式计算和逻辑比较实现了实用于机器学习模型的同态计算基础模块。与此同时,在密文计算场景下,比较运算往往伴随着破坏数据语义安全的风险。为保证在明文信息不被泄露的条件下准确地进行同态比较,本论文也专门对同态比较模块进行了特殊的处理。在这种同态比较函数中,将以多个密文为输入,并输出其相应的排序,从而实现在不破坏密文不可区分性的前提下进行同态比较。3.结合同态计算和明文编码的轻量级隐私机器学习方法。在使用面向机器学习应用的同态计算模块时,不同的明文编码方式有着不同的计算效率。论文通过调整明文编码矩阵,使得原有加密方案能有效地进行除法运算,进而将同态比较运算的效率提高了约30%。论文的创新在于以下几点:1.设计了一种基于共轭搜索的轻量级同态加密方案。使用该方案加密的数据来进行同态机器学习并不会显著提高计算时间复杂度。2.对机器学习过程中使用的激励函数及逻辑运算进行了特殊设计,使其在不违背语义安全的原则下能够以同态计算的方式进行。3.通过结合全同态计算和明文编码方式,构建了一种完整且有效的隐私机器学习方法。相较于基于错误学习问题的这类全同态加密方案,本论文所采用的方法具有更低的计算时间复杂度、更简单的计算操作以及更容易进行安全性规约等特点。相较于其它文献中使用的同态机器学习实验,实验证明,本文中的方法在训练效率上提高了6倍以上,但精度损失却仅有4%左右。这说明该方法适合在隐私机器学习模型中应用,有利于对训练以及分类/回归过程中的数据进行有效保护,具有较高的工程价值。
其他文献
红曲菌作为传统的药食同源微生物,可产生多种有益的代谢产物,如:红曲色素、洛伐他汀、γ-氨基丁酸等,但也会产生具有肾毒性的桔霉素,所以采用合适的方法研究红曲菌的代谢途径对促进其应用极为重要。丝状真菌的生长主要通过在菌丝的顶端延伸细胞壁和膜来实现,该过程与发生在Spitzenk(?)rper部分的胞吐作用以及发生在菌丝内的内吞作用密切相关。在真核细胞内,物质的运输是由囊泡来介导完成的。Rab蛋白是一种
学位
近年来,随着信息科技和城市智能化建设的发展,基于物联网技术的智能回收箱已在各大城市中得到广泛使用。智能回收箱的应用不仅能够提高城市居民的回收投递积极性,而且有利于标准化回收体系与绿色城市的构建。与传统的回收模式相比,智能回收模式具有回收定价明确、回收量与收益可量化程度高等特点,并且智能回收箱配备的传感系统可实现回收点与回收中心之间的通信。然而,城市居民对回收定价的敏感程度存在差异,智能回收产品定价
学位
随着移动互联网的蓬勃发展,各种网络图像和视频数据量呈现爆发增长,而对应的数据标签信息也越来越难获得。因此如何根据用户的不同需求,在海量的缺乏标签信息的图像数据中高效快速地检索出目标图像是一大挑战。由于图像哈希方法具有图像存储空间极低,计算简单且检索速度快等优点,而深度卷积神经网络可以同时提取到图像的局部特征以及传统算法很难获取的高层语义特征,因此结合深度学习和二值哈希的图像哈希检索方面的研究也受到
学位
由于姜黄素溶解度差、生物利用度低、化学不稳定和易光降解等,其在食品中的应用受到限制。薄膜是一种有效生物活性分子的运载体系。可食用薄膜作为活性物质运载体系已成为食品领域的研究热点,其中多糖和蛋白质是最常用的材料。然而,高亲水性和缺乏机械强度阻碍了它们在食品工业中的使用。因此,本研究以大米蛋白肽和壳聚糖为成膜基质,探究了壳聚糖分子量对复合薄膜各项性能的影响并用于负载姜黄素。此外,尝试采用京尼平和纳米纤
学位
随着资源枯竭、环境污染、气候变暖等问题逐渐凸显,以大力开发利用可再生能源为主体的能源革命正在世界范围内兴起。而风资源以其储量巨大、可再生、分布广泛和无污染的特点,成为最具发展前途的可再生能源,世界各国都在充分利用风能资源,大力发展风力发电事业。数十年来,风能发电行业因领先的科技而迅猛发展。为降低风电场提供有功功率与供电调度中心输出功率指示之间的偏差,并减少风输出功率震荡对供电安全平稳运转的负面影响
学位
光热转换是太阳光最直接有效的转换方式,实现太阳光光热效应的高效利用与光热转换材料密切相关。其中缺陷型结构CuxS光热转换材料,具有类似于贵金属基光热转换材料的局域表面等离激元共振效应(Localized Surface Plasmon Resonance,LSPR),在近红外区产生强吸收效应,因此光热转换效率高。相比于贵金属基光热材料的高成本,聚合物基光热材料的低稳定性,碳基光热材料的低效率,低成
学位
人字行星齿轮传动系统(HPGTS)的结构复杂,自由度个数多,且具有多重非线性因素,因此在高转速和大功率工况下,呈现出较多的非线性特性。人字齿轮传动相较于其他类型的齿轮传动而言有独特的优点,人字行星齿轮传动系统重合度高、传动比大、承载能力强,被广泛应用于需要传输大扭矩和大功率的环境,如船舶的动力系统、风机的传动系统、航空发动机等。通常大螺旋角、大模数人字齿轮用于重载传动,也就意味着大齿侧间隙的存在。
学位
GH3535合金是我国自主研发的一种镍基高温合金材料,也是非常重要的钍基熔盐堆候选结构材料。钍基熔盐堆虽然在常压下工作,但熔盐堆的一些关键构件如压力容器、熔盐泵、回路管道等仍处在一定动载荷的工况下并随时具有疲劳失效的风险。因此,为了解决该合金抗疲劳性能不足的问题,以确保熔盐堆长期、安全地运行,本文采用表面喷丸的强化方法来提高GH3535合金表面性能和抗疲劳性能。本文研究了喷丸压力和喷丸强度等参数对
学位
基于位置信息提供的服务(Location-Based Services,LBS)在现今的社会环境中已经成为了人们在日常生活中的基础需求。众多服务中日益增长的位置信息精度和实时性需求亟待满足。Wi-Fi通信系统的广泛部署使得基于Wi-Fi信号的定位算法成为研究热点。其中,使用接收信号强度(Received Signal Strength Indication,RSSI)的定位算法由于其无需更新硬件设
学位
泌乳性状是荷斯坦牛最重要的经济性状,受到多种因素的影响。催乳素是与泌乳直接相关的内分泌激素,研究表明,催乳素(PRL)基因多态性与泌乳性状有关,且在不同品种和地域之间表现出多态性。目的:为加快规模化奶牛场育种进展,建立高产核心群,本研究采用PCR-SSCP方法以及测序对新疆南疆某地区荷斯坦牛群体中催乳素基因外显子1-5进行遗传多态性分析,旨在通过分析其多态性对泌乳相关性状的影响,筛选可能的分子遗传
学位