论文部分内容阅读
随着人口信息系统应用范围的不断扩大,数据将急剧增长,简单的设施的扩容虽然能在一定时期满足人口信息系统的需求但不是长久之计。云计算的便利、经济、高可扩展性等优势吸引了越来越多的目光,将人口信息系统的数据存放到云平台能够在很大程度上减少预算和繁杂的IT基础设施维护的工作量而且也减少了因为本地服务器宕机而导致信息丢失所造成巨大损失的顾虑。但将人口信息系统数据存储于云服务平台会面临隐私保护的巨大问题。首先,人口信息系统所采集的数据包括孕龄夫妇的年龄、性别、家庭住址、身份证号、疾病信息以及胎儿信息甚至包括了出生缺陷胎儿的基本信息,所以数据具有高隐私保护性、一次性获得等特点。其次,云服务平台完全由云服务提供商掌控,所以数据信息还存在由于云服务提供商的不可信性导致的隐私泄露。所以研究人口信息系统数据明文存储于云服务平台的隐私保护技术具有非常重要的意义。首先对于人口信息系统从架构和数据特点两个方面进行了分析,之后对于云服务平台和现有的隐私保护技术进行了研究。在研究的基础上结合人口信息系统数据的特点通过基于互斥数据属性对人口信息系统数据进行切片,并与第三方服务提供商的隐私保护策略交互生成数据分片标签DTL,由于数据切片后仍然存在隐私泄露风险,所以通过平均化机制进行数据伪造达到切片数据间关系混淆。防止数据切片间遭受关联攻击,由于云服务提供商存在由于利益驱使出卖用户数据信息的问题,所以设计了引入半可信第三方服务提供商的隐私保护模型。本文所提出的基于半可信第三方的隐私保护模型是解决人口信息系统中的数据存储到云服务平台所面临的数据隐私泄露问题。通过引入的基于互斥数据属性的数据切片以及半可信第三方的隐私保护策略所生成的数据切片标识,达到人口信息系统数据在模型中的存储流程、人口信息系统数据的删除、读取流程的隐私保护。最后,对于模型的安全性指标进行了分析,能够达到对人口信息系统数据的隐私保护的目的。