论文部分内容阅读
近年来,随着社交网络、传感器技术、互联网技术的快速发展,每天产生的数据数量急剧膨胀,数据如何存储成为了一个难题。大数据计算和云存储技术使得大量数据的存储和获取成为可能。网络用户可以将自己的数据从本地迁移到云端,这样既节约基础设施的花销又能对数据进行更加高效的管理。但是由于云端自身的开放性和共享性,存储在云端的数据安全性受到非常大的挑战,于是对云端数据进行加密是常见的解决办法。对于加密后的云端数据如何使用,一种方式是下载下来解密后使用,但是这种方式仅适用小型数据,对于大数据而言无法使用,因此寻找一种在云端可搜索加密技术成为解决这一问题的关键技术。当数据在云端安全存储时,数据不会暴露给除用户以外所有人,并且用户可以通过关键词对数据进行安全检索。目前可搜索加密技术在加密类型上主要分为可搜索对称加密SSE和可搜索非对称加密SAE,在构造加密检索方案上主要分为基于线性查找的可搜索加密和基于索引的可搜索加密方案。这些可搜索加密方案在安全性和性能方面各有重点,能够解决不同场景下的业务需求。本文对可搜索对称加密方案进行了大量研究,分析了近年来研究人员提出的可搜索加密方案,进而开展以下三个方面工作:1.提出了一个在全文检索场景下,基于安全索引的可搜索加密改进方案。在方案中,本文构建了方案的安全性假设,利用预言机模型对方案安全性假设进行证明。同时,在保证检索安全性的前提下,优化了云端检索复杂度,使之达到对数级的检索复杂度,实现的可搜索加密方案的实用性。2.提出了一种基于Hadoop的密文检索框架,通过Hadoop集群计算使得我们改进的可搜索加密方案能够用于大数据环境。同时给出了详细的基于Hadoop的索引构建流程和检索流程,有效的支撑了本文基于Hadoop的密文检索方案。3.实证研究方面,实现了国内外提出的多种流行可搜索加密方案和本文改进后的方案,并且对索引构建性能和检索性能两个关键指标进行比较。本文方案在索引构建上与其他方案相差不大,但实验表明本文的方案能够达到基于陷门的对数级的检索时间,优于其他方案中线性的查找时间,从检索效率上更适合于大数据环境。