云计算环境下数据挖掘安全外包关键技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:yng2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着云计算技术的快速发展,云服务商为用户提供了性能强大且具有弹性的数据存储和计算资源,将数据挖掘工作外包至云环境可以显著降低用户的运行维护成本。然而,由于云环境存在数据泄露等多种安全威胁,且云服务商对于用户而言不完全可信,用户的外包数据存在隐私泄露的风险。因此,如何保证云端数据挖掘过程中数据和结果的安全性已成为云计算安全领域亟待解决的关键问题。现有的数据挖掘安全外包方案通常无法同时满足高安全性和高效性的应用要求,并且在外包计算时可能需要用户的在线参与,从而影响了方案的适用性。针对这些问题,本文在深入分析云计算环境下数据挖掘安全外包问题的基础上,重点针对k近邻分类、深度神经网络分类、k均值聚类和频繁项集查询的安全外包技术展开研究,构建了合理的系统模型和安全模型,设计了安全高效且无需用户在线的安全外包方案,提高了数据挖掘安全外包的实用性。本文的主要研究工作和创新包括以下几个方面:1.针对现有k近邻分类安全外包方案在安全性、运算效率和适用性上存在的不足,提出了一种基于高效加密算法的k近邻分类安全外包方案,其支持在大规模密文数据库上进行高效的k近邻分类。该方案的主要创新点包括:(1)设计了数据库密钥生成协议、数据库加密协议、查询数据点加密密钥生成协议、查询数据点加密协议、分类标签重加密密钥生成协议、密文k近邻分类协议和分类标签解密协议,并基于这些协议构建了k近邻分类安全外包方案;(2)在半诚信安全模型下进行了详细的安全性分析,证明了该方案能够有效保护数据库安全、解密私钥安全和查询隐私,同时能够隐藏数据访问模式;(3)进行了详细的实验性能分析,实验结果表明该方案具有较高的运算效率。2.针对现有k近邻分类安全外包方案无法同时满足密文语义安全和低计算开销的不足,提出了一种基于混合公钥加密的k近邻分类安全外包方案,实现了基于语义安全的混合密文数据库上的高效k近邻分类。该方案的主要创新点包括:(1)提出了一种安全内积协议进行密文距离值计算,相比于现有的密文距离计算协议,该协议具有更低的计算开销;(2)提出了一种抗合谋重加密密钥生成协议,保证了云服务器在合谋查询用户的情况下仍无法得到相应的解密密钥;(3)通过使用安全内积协议和代理重加密协议作为子协议,提出了一种密文k近邻分类协议,实现了安全高效的密文k近邻分类;(4)进行了详细的安全性证明和实验性能分析,实验结果表明该方案具有较高的运算效率。3.针对现有深度神经网络分类安全外包方案在密文分类结果准确率和执行效率上存在的不足,提出了一种基于全同态加密的深度神经网络分类安全外包方案,较好地满足了方案对高安全性、高效性和高分类准确率的应用要求。该方案的主要创新点包括:(1)提出了一种参数自适应学习的多项式激活函数,其多项式参数在网络训练过程中能够自适应学习和更新,从而具有更好的分类性能;(2)设计了三种规模较小的卷积神经网络模型,从而保证了密文分类的运算效率;(3)使用全同态加密算法对用户数据进行加密从而保证了数据安全,外包分类过程由云服务器完成而无需用户的在线参与;(4)进行了详细的实验性能分析,实验结果表明该方案同时满足了分类外包对高准确率和高效率的要求。4.针对现有k均值聚类安全外包方案无法同时支持密文语义安全和高运行效率的不足,提出了一种基于全同态加密的k均值聚类安全外包方案,其支持在语义安全的密文数据库上进行高效的聚类计算。该方案的主要创新点包括:(1)设计了数据库加密协议、安全比例因子计算协议、安全平方欧氏距离协议、安全簇更新协议、安全终止条件计算协议和安全簇心解密协议,并基于这些协议构建了k均值聚类安全外包方案;(2)使用密文打包技术实现了密文聚类过程中高效的并行计算,显著提高了方案的运算效率,且所有外包聚类过程由云服务器完成而无需用户的在线参与;(3)在半诚信安全模型下进行了详细的安全性分析,证明了该方案能够有效保护数据库安全和聚类结果隐私,同时能够隐藏数据访问模式;(4)进行了详细的实验性能分析,实验结果表明该方案能够高效地在大型密文数据库上进行k均值聚类。5.针对现有频繁项集挖掘安全外包方案在安全性、高效性和适用性上存在的不足,提出了一种基于混合同态加密的频繁项集查询安全外包方案,其支持在语义安全的密文数据库上进行高效的频繁项集查询。该方案的主要创新点包括:(1)设计了事务数据库加密协议、项集加密协议、安全频繁项集挖掘协议和安全支持度解密协议,并基于这些协议构建了频繁项集查询安全外包方案;(2)使用密文打包技术实现了密文挖掘过程中高效的并行计算,显著提高了方案的运算效率,且所有外包挖掘过程由云服务器完成而无需用户的在线参与;(3)在半诚信安全模型下进行了详细的安全性分析,证明了该方案能够有效保护数据库安全和查询结果隐私,同时能够抵抗频率分析攻击;(4)进行了详细的实验性能分析,实验结果表明该方案能够高效地在大型密文数据库上进行频繁项集查询。
其他文献
随着大数据和硬件计算资源的发展,人工智能当前进入了深度学习时代,深度学习时代具有两个最为显著的特点:一是计算量大,二是在多个应用领域效果远超传统方法。传统的人工智能方法虽然计算量相对较少,但是其性能遇到了天花板,很难进一步提高,而目前来看深度学习只要数据量足够,通过合理的网络设计以及足够的计算其在性能上往往都具有非常高的潜力。为了获得足够的深度学习计算加速,当前展开了各种硬件竞赛,比如GPU上针对
机器学习作为人工智能技术的核心支撑受到了广泛的关注。数据规模不断增长,对最优化方法求解机器学习模型带来了新的挑战。本文以提高随机最优化方法在大数据条件下的收敛速度和精度为目标,针对随机梯度降噪算法计算效率低、自适应梯度方法泛化能力低、随机拟牛顿方法收敛速度慢、基于随机梯度下降的Lookahead方法调参要求高等问题,从随机梯度下降算法的弹性降噪、自适应梯度方法的边界调度、随机拟牛顿方法的降噪加速、
随着近年来国内外多条商业运营线路的开通,磁浮列车逐渐成为轨道交通领域研究和发展的热点和焦点。高速磁浮列车作为一种新型轨道交通制式,对于解决大城市间的快速交通问题,建立和完善我国高效立体的高速客运体系具有重要意义。本文以时速600公里高速磁浮列车悬浮系统为研究对象,对悬浮系统的性能优化问题展开研究。论文针对高速磁浮列车悬浮搭接结构建立数学模型,并根据模型特性设计标称控制器。由于高速磁浮列车长期运行过
计算机生成兵力(Computer Generated Forces,CGF)是作战仿真领域的关键前沿技术之一。意图识别行为是CGF认知行为建模的重要研究方向,可有效解决现有模拟仿真系统中CGF行为模式固定可预测、对抗与协同能力不足、态势分析与处理水平低等问题。策略型意图识别行为建模是考虑战场竞合关系条件下,对一般意图识别行为的泛化研究,有助于CGF更富策略性地识别敌友作战意图。研究面向CGF的策略
动态目标防御技术是一种新型的网络安全技术,通过构建、评价和部署多样化、不断迁移并且随时间变化的机制及策略的方式,增加攻击者的攻击难度及代价,有效限制脆弱性的暴露及被攻击的机会,提高系统的弹性。本文结合新一代网络架构SDN直接灵活、集中式的网络控制能力优势,对动态目标防御网络的相关关键技术进行了深入研究,主要研究工作及创新点如下:对于基于SDN的路由随机变换技术,本文分析了路由随机变换的相关问题,从
随着人们对互联网的依赖日益加深,保证互联网正常且稳定地运行是社会稳定运行的前提。但随着网络安全威胁技术不断升级,新的网络安全威胁不断涌现,网络安全面临较严峻的形势。而网络规模的不断增大,网络流量数据规模的增大,给网络流量的分析和异常检测带来了许多困难。因而,如何实时准确地发现大规模网络中存在的网络流量异常行为,保障网络正常且有效地运行,对提高网络的可用性和可靠性具有重要的意义。目前网络流量异常检测
近年来,人工智能技术迅猛发展,在全球范围内受到了广泛关注。以卷积经网络(Convolutional Neural Networks)、图卷积神经网络(Graph Convolutional Neural Networks)为代表的深度学习算法的不断更新迭代对计算机系统的计算性能与能耗要求急剧提高。然而,由于近年来摩尔定律发展的停滞以及冯诺伊曼结构限制,现有的数据中心架构无法高效地实现深度学习与大数
场景重建与语义分析理解是计算机视觉、计算机图形学以及机器人学中的难点。随着工业和娱乐领域对数字几何需求的不断增长,对场景进行建模与分析理解比过去任何时候都更加重要。近年来深度扫描技术的快速发展使得场景的数据建模越来越便捷,由于这一技术的革新,场景的重建和语义分析技术经历了由简单到复杂以及由低维到高维的发展演变。另一方面,移动机器人经过多年的研究和发展,已经逐步走向实用化,在制造业、物流业、服务业等
从片上多核系统到高性能计算机系统,互连网络作为节点之间通信的基础部件,一直是限制系统性能提升的瓶颈。路由器是互连网络的基础结构单元,负责网络中报文的转发,是影响网络吞吐率和报文传输延迟的关键部件。路由器基本结构包括输入端口、缓存、交换开关和输出端口等。其中,缓存用于存储路由器中等待转发的报文,而交换开关负责将报文无冲突的从路由器输入端口转发到输出端口。片上网络通常通过简化路由器流水级来降低报文通过
计算机生成兵力(Computer Generated Forces,CGF)战术任务规划是在作战仿真系统中,CGF为达到其作战目的而进行的一系列规划推理和选优决断活动,是构建真实可信的作战仿真系统的重点和难点。目前的CGF战术任务规划行为建模技术存在领域知识获取困难、战场环境不确定、行为模型过于简单等问题,针对这些不足,论文以研究CGF行为建模中战术任务规划行为模型框架为目标,重点围绕战术任务规划