论文部分内容阅读
云计算的应用和发展使得数据外包成为一种新的趋势。外包到云上的数据通常体量较大,个人或组织不具备相应的存储和计算能力,因此数据外包将用户从繁重的数据维护和管理任务中解放出来,不再受限于有限的本地设备资源。然而外包模式带来了新的安全问题,外包数据可能包含隐私信息,用户不希望隐私数据被泄露给云服务提供商,加密处理是一种必要选择。但是查询是数据管理领域的一个核心问题,当用户对存储在云服务器上的数据进行查询时,为了防止隐私泄露,也必须将查询请求加密。使用传统的加密方式,云服务器无法提供有效的密文查询机制,而现有的解决方案往往带来了极大的计算开销和通信开销。因此,外包数据环境下的密文查询方案成为新的安全挑战。本文面向结构化多维向量数据类型,针对外包数据环境下数据安全与隐私保护的关键问题:安全范围查询和安全近邻查询提出解决方案。主要的贡献如下:基于位置的服务下的安全范围查询方案。针对现有方案存在的交互轮数多和用户端计算开销大的问题,提出了基于安全KD(SKD:Secure K-dimensional)树密文索引结构的安全范围查询算法。SKD树将可比较加密(CE:Comparable Encryption)体制与KD树索引结构相结合,通过适当优化减少查询过程中的递归层数,实现无需可信用户干预下的密文范围查询。得益于CE的直接密文比较特性和KD树的超矩形空间划分机制,基于SKD树的安全范围查询方案将用户与服务器之间的交互轮数减小至一轮,降低了用户端的计算开销和通信开销。面向高维数据空间的安全k近邻(SkNN:Secure k Nearest Neighbor)查询方案。基于私有云模型解决查询用户与云服务器均不可信的问题。采用乘积量化(PQ:Product Quantization)技术和倒排文档(IVF:Inverted File)索引实现高维向量的降维表达,引入Paillier同态加密算法防止距离表造成的隐私泄露,并通过用户与服务器之间的协同计算解决同态密文的比较问题。方案提高了用户端的计算效率,并采用粗聚类填充和密文扰动方法加强了存储在服务器上的数据的安全性。随后提出的二次粗量化方法进一步优化了通信开销。本文提出的安全查询方案较好地保证了查询过程中的数据安全,并提供了安全性与效率的折中。在真实数据集上的仿真以及与现有方案的对比验证了本文所提方案的优势。