论文部分内容阅读
在海量数据不断产生的现今,用户本地存储所面对的压力日益增加。利用云服务器来存储用户数据,能够极大缓解用户本地的存储压力与运营成本。云存储给用户提供了平稳、高效、低耗的数据访问,满足用户对数据随存随取的需求。与此同时,云存储也存在着许多亟待解决的问题,其中安全问题是这些问题的重中之重。针对上述安全问题,为了保护用户的个人数据与隐私信息的安全性,在本地把用户数据进行加密,然后上传加密数据是目前应用最广泛的解决方法。然而,这种解决方法带来了一个新的问题,就是明文环境下的高效检索方案都会失效;而且传统的加密技术已经不足以支持现今的大数据环境。因此,在保证数据安全的前提下,如何有效的实现高性能的检索是现在所面临的重要问题。现有的国内外的解决方案已经有很多,这些方案大多都是以关键词作为文档索引构建特征。现有方案已经能实现排序检索、相似度检索等多种功能。目前,在模糊检索中的多关键词检索方案还比较少。另外,对于用户输入的检索关键词,现有方案都是将每一个单词都分配相同的比重。这样忽视了关键词之间所具有语义关系,这会导致语义缺失,检索精确度降低。因此,基于上述两个问题,在保证数据的隐私安全的同时,如何构建加密检索的语义性,是现在面临的一个很大挑战。以此为目标,本文提出了基于语义感知和基于二级索引的两个可搜索加密方案。本文的主要工作包括:1)双服务器下基于扩展概念层级的语义感知检索。概念层次结构树是基于外包数据集的相关知识构建的。为了包含更多的语义信息,我们对概念层次进行了进一步的扩展。借助扩展的概念层次结构,可以更精确地提取文档特征,对用户的检索词进行有效的语义扩展。对于文件集的每一个文件,在索引构建时,会生成两个向量,分别用于语义概念匹配与相似度计算。相应地,搜索请求的搜索陷门也包括两个向量。双服务器的作用是分步进行检索,一个用于索引向量和用户检索的相似度计算,另一个用于对结果进行排名并将其返回给用户,这样的拆分使得检索更为高效。对于两种不同的威胁模型,本章构建了两个完整的检索方案,并对两个方案都进行了真实环境下的实验证明。2)基于二级索引的隐私保护内容感知检索。与现有的多关键词搜索方案不同,索引构建采用了新颖的两级索引结构。二级索引结构结合了现有的正向索引和反向索引结构。与一般正向索引相比,该方案更好的提高了搜索效率。所提出的二级索引方案使用查询关键字的中心关键字进行搜索,因此检索的复杂性仅取决于与关键字相关的文件集的大小。由于搜索结果的准确性主要取决于查询关键词的中心关键词,为了进一步提高搜索结果的语义性和准确性,本文对查询的中心关键词进行了扩展。本章首先给出了基于二级索引的中心关键字扩展语义搜索的基本框架。然后,针对不同威胁模型下的隐私保护要求,给出了两种特定的密文搜索方案,同时在现实环境下对方案进行实验证明。