论文部分内容阅读
随着信息化技术的不断发展,云计算技术的应用也日益成熟。在云计算技术中,云存储作为其核心部分,以其简便性和高效性,满足了人们基本的存储需求。然而在云存储中,为了保护用户隐私安全,用户将文件发送给云服务器之前需要对文件进行加密,这样用户对云服务器中密文数据的有效利用是云存储面临的一项严峻的挑战。不同于明文检索,密文检索需要在保证检索的效率的同时保证用户隐私安全。尽管传统的可搜索加密方案解决了用户对于密文数据的关键词检索问题,然而对于海量数据的云存储系统来说,传统可搜索加密方案的工作效率仍有待提高。因此,对于云存储中的密文检索,还有很多需要改进的地方。本文分析了目前已有的几种云存储密文排序检索方案,包括基于传统对称可搜索加密方案的RKSE(Ranked Keyword Search over Encrypted data)方案,实现了单关键词的密文排序检索,然而由于该方案需要对索引进行线性扫描,效率不高;以二叉树作为索引的结构的MRSE(Multi-keyword Ranked Search over Encrypted data)方案引入了向量查询的概念,使用索引向量和查询向量的余弦值作为多个关键词与文件的相似性指标,从而实现了多关键词的密文排序查询,然而,该方案仅支持多关键词的并集查询,并且对于索引的修改过于复杂,同时使用二叉树作为索引检索的效率也并不高。本文结合了已有密文检索方案的优势和不足,设计了一个支持多关键词密文排序检索的云存储系统。从安全性角度出发,本文在系统模型中加入了一个代理服务器进一步保证了用户隐私安全;从检索的效率出发,本文提出了一个二叉树嵌套于B+树的双树索引结构,并通过仿真实验验证了该索引结构的高效性,在该结构下对索引的建立、修改以及检索操作效率均得到了较大的提升;同时使用TF×IDF准则对文件进行预排序,提升了密文排序检索的效率。针对已有方案关键词陷门函数计算不够简便的问题,本文使用关键词的哈希值作为关键词陷门,在保证关键词密文不易被破译的同时简化了陷门函数的计算。本文提出的方案支持对不同逻辑关系的多个关键词进行密文排序检索,同时减少了对检索结果进行排序的计算量,提高了检索效率。