论文部分内容阅读
随着大数据时代的发展,互联网每时每刻都产生着海量的数据,这使得数据的存储和计算需求日益增大。云计算平台能够为云租户提供强大的存储空间和雄厚的计算资源,云租户只需要支付相对廉价的费用,就可以将繁重的计算和存储任务外包给云服务器,从而提高计算效率并节省云租户的开支。但存储和计算的外包将会使云租户失去对数据的直接控制,导致云租户数据的隐私信息泄露,譬如个人电子医疗信息、金融交易或商业文件等。因此,如何保障数据安全,实现数据的隐私保护成为近几年的研究热点。加密技术是保护隐私数据存储安全的主要手段之一。加密后的数据可直接上传到服务器端,实现数据的外包存储。而传统的加密技术将数据转化为无法识别的密文,丧失了大部分的语义特征,使得服务器端无法实现对密文数据的操作,如安全的密文检索、有效的集合操作等。因此,对于大部分数据来说,在实现隐私保护密文存储的基础之上,能够进行数据的密文检索以及集合操作等则具有更实际的应用价值。本文主要从隐私保护下数据的密文检索和集合操作两大方面展开相关研究,设计满足实际需求的隐私保护算法。1.隐私数据的密文检索。如何从存储在云端的海量密文数据中检索到用户感兴趣的信息是近几年的研究热点。数据以密文的形式外包存储在云端,而基于传统加密构造的密文检索方案只能实现简单的密文检索,无法对外包密文数据进行访问控制。在基于属性加密的机制中,数据拥有者制定访问控制策略实现对数据的细粒度访问控制,即只有满足策略的数据使用者才能对密文数据进行解密,这种机制实现了对外包数据的授权共享。因此,将属性加密机制的优势与密文检索相结合,即基于属性加密的密文检索,可以有效地实现密文数据的授权检索。而在已有的研究工作中,密文中的访问控制信息是直接被泄露的,无法保护密文策略的隐私以及抵抗关键字猜测攻击。针对此问题,本文提出了隐藏策略的基于属性加密的密文检索(Hidden Policy Ciphertext-Policy Attribute-Based Encryption with Keyword Search,HP-CPABKS)方案,并给出了详细的安全性证明与实验数据分析。该方案使用"与"门访问控制策略和非对称双线性对操作,主要实现了:(i)数据拥有者制定访问控制策略,实现对密文数据的细粒度访问控制功能;(ii)满足访问控制策略的用户可以将复杂的检索操作委托给云服务器,由云服务器实现密文检索功能,同时不泄露原始数据的隐私信息;(iii)有效地实现了对访问控制策略的隐私性保护,并成功地抵抗了关键字猜测攻击。2.隐私数据的集合操作。如何在隐私保护的前提下从不同的数据库中提取出相同或者近似的记录和信息也是本文研究的另一个主要内容。而集合交集计算作为集合操作的基础运算,可以有效地应用到电子医疗数据库记录匹配或者在线推荐系统中。随着数据库中数据量的不断增大,高效快速地挖掘出数据集之间的相关信息才能更好地满足实际需求。集合相似度计算不同于集合交集计算,只需要计算出集合之间的一个统计信息,即相同元素所占比例,而无需得到具体的相同元素。集合相似度计算的应用也非常广泛,如相似图片查找、文章剽窃检测等。本文针对隐私集合交集计算和集合相似度计算分别从功能和效率上展开相关研究,主要内容包含:·基于传统公钥加密的隐私集合交集方案,需要大量开支管理公钥证书。本文将基于身份的加密机制应用到隐私集合交集中,大大地简化了公钥证书的管理。同时,在已有的对称集合交集协议中,计算双方之间需要大量的交互。为了尽量减少双方之间的交互,并实现结果输出的对称性,本文设计了基于身份的对称的隐私集合交集协议(Identity-Based Symmetric Private Set Intersection,IBSPSI)。协议中利用组合公钥的技术,避免了加密算法中复杂的双线性对操作,有效地提高了整个协议的计算效率。安全性分析和实验结果表明IBSPSI协议是语义安全的且在实际应用中是切实可行的。·为了减轻IBSPSI中客户端的计算以及存储负载,本文利用云平台的计算和存储资源实现数据存储及计算外包,结合基于身份加密的无证书管理优势,构造了基于身份加密的密文集合匹配(Identity-Based Private Matching over EncryptedData,IBPM)的外包计算方案,将复杂的密文集合操作委托给云服务器。IBPM方案还实现了对数据的细粒度访问控制,即云计算服务器只有拿到用户的授权令牌时才能对其数据集合进行交集操作。在DBDH和DLN困难假设下证明了IBPM是选择性安全的,同时在具体数据库上进行了效率验证,数据结果显示该方案能够满足实际应用需求。·大数据量的快速增长使得对计算效率的要求也随之提升。结合数据挖掘中的Minhashing算法,利用近似计算逼近精确计算,实现了大数据集下安全高效的集合相似度计算。文中还提出了近似计算的验证机制,保证了第三方辅助服务器返回的计算结果的正确性,并对验证机制进行了详细的理论分析。通过实验进行测试分析,相比于已有方案,本文提出的方案大大提升了计算效率,更能满足实际应用需求。同时,实验结果表明,验证机制的实际测试结果与理论结果完全一致。