论文部分内容阅读
云存储经过多年的发展,日益成为互联网活动中不可或缺的重要组成部分。大量个人以及企业用户将数据存储于云端,既可减少本地的存储维护成本,又可随时随地访问自己的数据。然而用户得益于云存储的同时,也丧失了对数据的直接控制,这引起了一系列的安全问题。在这些安全问题中,数据的存储位置在一定条件下尤其重要,如国家公民信息以及健康医疗数据包含了大量的隐私,甚至关乎国家安全,因此其存储位置必须满足一定的限制。目前一些国家已制定相关法律法规明确限制敏感数据的存储位置。但云服务商出于节约成本的目的,可能将数据存储至维护成本较低的位置,从而违反用户对存储位置的要求。因此,亟需一种可靠的技术来定位存储于云端的数据。然而,云端数据定位的相关研究成果较少,且已有方案均在北美以及欧洲部署并实验,缺少在我国网络环境下的研究分析。本文根据云存储的实际场景,设计并实现了一种云端数据定位方案。首先,本文分析了云端数据定位中的参与角色,建立了系统模型,介绍了与定位相关的特征,分析了可能存在的攻击,提出了云端数据定位的安全目标。随后在此基础上,设计了一种基于机器学习的云端数据定位方案。该方案结合了IP定位技术的原理以及数据完整性技术,利用机器学习训练相关特征与位置的关系。在方案的详细构造阶段,构造了两种不同实现,这两者在计算与通信开销方面存在差异。此外,本文结合存在的攻击,分析了方案的安全性。然后在我国环境下部署所提方案,收集所需数据,通过实验验证方案的可行性,研究可能影响方案定位精度的参数。鉴于固态硬盘在云端的普及,分别在机械硬盘与固态硬盘的存储条件下,对方案的两种实现进行模拟云环境的实验,实验研究了不同硬件配置、相关参数以及攻击对定位精度的影响。随后在真实的云环境对两种实现进行定位实验,并对攻击进行模拟,测试并分析定位精度,通过实验数据分析安全性。最后,本文从各项性能指标出发,对比所提方案两种实现的差异以及适用条件,并与现有方案进行了比较。实验表明,本文基于机器学习的方案实现了城市级别的定位,满足所提出的安全目标,使用固态硬盘时的定位精度高于机械硬盘,且定位精度高于现有相关技术方案。