论文部分内容阅读
随着云计算技术的快速发展,云服务商为用户提供了性能强大且具有弹性的数据存储和计算资源,将数据挖掘工作外包至云环境可以显著降低用户的运行维护成本。然而,由于云环境存在数据泄露等多种安全威胁,且云服务商对于用户而言不完全可信,用户的外包数据存在隐私泄露的风险。因此,如何保证云端数据挖掘过程中数据和结果的安全性已成为云计算安全领域亟待解决的关键问题。现有的数据挖掘安全外包方案通常无法同时满足高安全性和高效性的应用要求,并且在外包计算时可能需要用户的在线参与,从而影响了方案的适用性。针对这些问题,本文在深入分析云计算环境下数据挖掘安全外包问题的基础上,重点针对k近邻分类、深度神经网络分类、k均值聚类和频繁项集查询的安全外包技术展开研究,构建了合理的系统模型和安全模型,设计了安全高效且无需用户在线的安全外包方案,提高了数据挖掘安全外包的实用性。本文的主要研究工作和创新包括以下几个方面:1.针对现有k近邻分类安全外包方案在安全性、运算效率和适用性上存在的不足,提出了一种基于高效加密算法的k近邻分类安全外包方案,其支持在大规模密文数据库上进行高效的k近邻分类。该方案的主要创新点包括:(1)设计了数据库密钥生成协议、数据库加密协议、查询数据点加密密钥生成协议、查询数据点加密协议、分类标签重加密密钥生成协议、密文k近邻分类协议和分类标签解密协议,并基于这些协议构建了k近邻分类安全外包方案;(2)在半诚信安全模型下进行了详细的安全性分析,证明了该方案能够有效保护数据库安全、解密私钥安全和查询隐私,同时能够隐藏数据访问模式;(3)进行了详细的实验性能分析,实验结果表明该方案具有较高的运算效率。2.针对现有k近邻分类安全外包方案无法同时满足密文语义安全和低计算开销的不足,提出了一种基于混合公钥加密的k近邻分类安全外包方案,实现了基于语义安全的混合密文数据库上的高效k近邻分类。该方案的主要创新点包括:(1)提出了一种安全内积协议进行密文距离值计算,相比于现有的密文距离计算协议,该协议具有更低的计算开销;(2)提出了一种抗合谋重加密密钥生成协议,保证了云服务器在合谋查询用户的情况下仍无法得到相应的解密密钥;(3)通过使用安全内积协议和代理重加密协议作为子协议,提出了一种密文k近邻分类协议,实现了安全高效的密文k近邻分类;(4)进行了详细的安全性证明和实验性能分析,实验结果表明该方案具有较高的运算效率。3.针对现有深度神经网络分类安全外包方案在密文分类结果准确率和执行效率上存在的不足,提出了一种基于全同态加密的深度神经网络分类安全外包方案,较好地满足了方案对高安全性、高效性和高分类准确率的应用要求。该方案的主要创新点包括:(1)提出了一种参数自适应学习的多项式激活函数,其多项式参数在网络训练过程中能够自适应学习和更新,从而具有更好的分类性能;(2)设计了三种规模较小的卷积神经网络模型,从而保证了密文分类的运算效率;(3)使用全同态加密算法对用户数据进行加密从而保证了数据安全,外包分类过程由云服务器完成而无需用户的在线参与;(4)进行了详细的实验性能分析,实验结果表明该方案同时满足了分类外包对高准确率和高效率的要求。4.针对现有k均值聚类安全外包方案无法同时支持密文语义安全和高运行效率的不足,提出了一种基于全同态加密的k均值聚类安全外包方案,其支持在语义安全的密文数据库上进行高效的聚类计算。该方案的主要创新点包括:(1)设计了数据库加密协议、安全比例因子计算协议、安全平方欧氏距离协议、安全簇更新协议、安全终止条件计算协议和安全簇心解密协议,并基于这些协议构建了k均值聚类安全外包方案;(2)使用密文打包技术实现了密文聚类过程中高效的并行计算,显著提高了方案的运算效率,且所有外包聚类过程由云服务器完成而无需用户的在线参与;(3)在半诚信安全模型下进行了详细的安全性分析,证明了该方案能够有效保护数据库安全和聚类结果隐私,同时能够隐藏数据访问模式;(4)进行了详细的实验性能分析,实验结果表明该方案能够高效地在大型密文数据库上进行k均值聚类。5.针对现有频繁项集挖掘安全外包方案在安全性、高效性和适用性上存在的不足,提出了一种基于混合同态加密的频繁项集查询安全外包方案,其支持在语义安全的密文数据库上进行高效的频繁项集查询。该方案的主要创新点包括:(1)设计了事务数据库加密协议、项集加密协议、安全频繁项集挖掘协议和安全支持度解密协议,并基于这些协议构建了频繁项集查询安全外包方案;(2)使用密文打包技术实现了密文挖掘过程中高效的并行计算,显著提高了方案的运算效率,且所有外包挖掘过程由云服务器完成而无需用户的在线参与;(3)在半诚信安全模型下进行了详细的安全性分析,证明了该方案能够有效保护数据库安全和查询结果隐私,同时能够抵抗频率分析攻击;(4)进行了详细的实验性能分析,实验结果表明该方案能够高效地在大型密文数据库上进行频繁项集查询。