论文部分内容阅读
随着互联网的快速发展和用户海量数据处理需求的不断扩大,云服务得到了越来越多企业和用户的关注,用户将本地的数据与资源上传到云服务提供商中,云端根据用户需求对数据进行存储、计算等操作,用户可以直接使用云端提供的服务而无需考虑具体的操作细节。为了保证存储在云端数据的安全,通常将数据加密后上传到云中,加密后虽然保证了安全性,但是也影响了数据的计算、查询等操作。通过对已有密文检索方案的分析,目前众多方案在检索过程中都存在用户查询模式和访问模式泄露的问题,因此需要设计出支持隐私保护的密文检索技术。本文主要研究并解决云端密文检索隐私保护的问题。首先为了防止用户检索时的隐私泄露,引入私有信息检索技术,提出了一种基于关键词的私有信息检索方案,解决了一般私有信息检索方案只支持利用物理地址进行检索的问题。然后在方案的详细设计中,对算法的相关细节进行了详细阐述,在保障检索安全性的同时提高了检索效率。本文所做的具体工作如下所示:(1)提出了一种基于关键词的私有信息检索方案。利用布隆过滤器构造关键词与文档存储地址的哈希映射,解决了一般私有信息检索需要提前知道检索文档物理地址的问题,能够在保证空间效率的同时,迅速查询到与检索词相关的信息。(2)对基于关键词的私有信息检索方案进行详细设计,主要分为三个模块:密文存储模块、关键词检索模块、文档检索模块。密文存储时使用两个缓存区存放文档存储地址,利用关键词进行检索时,通过向两个缓存区发送不同的查询请求,并且将返回的结果进行异或得到文档存储地址,极大地提高了检索效率。利用文档存储地址进行文档检索时,将查询请求利用Paillier同态加密方案进行加密,云端根据提交的查询请求计算出查询结果并返回给用户,用户解密后得到检索结果并且不泄露用户的访问模式。(3)对面向云的密文检索系统进行实现。该系统在Hadoop环境下结合MapReduce编程模型,将文档分块后存放在分布式文件系统的各个节点上,通过并行计算的方式对各节点进行私有信息检索,将计算结果进行归并后得到最终检索结果,并且对检索效率和准确率进行相关测试,验证算法的性能。