论文部分内容阅读
云环境下健康大数据的研究对于分析疾病的分布、扩散趋势以及预防都具有重要的价值,为了使研究者能够对健康大数据进行研究,需要对健康大数据进行存储和发布。而健康大数据涉及用户的隐私信息,这些信息的泄露会对用户造成极大的危害。因此,为了既能够使研究者获得可研究的健康大数据,同时又能保护用户隐私,我们需要对云环境下健康大数据的隐私保护技术进行研究,并将经过处理的健康大数据发布给研究者。信息发布者通常会将健康大数据中涉及用户隐私的属性进行删除或者泛化,并保留具有研究价值的数据属性。本文对云环境下健康大数据存储安全、健康大数据发布安全、隐私保护技术以及相关法案进行了深入研究,并对国内主流安全厂商的核心产品进行研究并将其应用到本文所提出的云环境下健康大数据隐私保护安全方案中,从而对健康大数据进行全面的保护,实现对健康大数据最大程度的保护。本文主要的研究成果如下:(1)提出了云环境下健康大数据隐私保护方案。本文涉及的健康大数据对隐私保护要求高,需要充分考虑方案的安全性和实用性。经过对数据安全保护方法深入研究之后,本文提出了集物理安全设备、匿名化处理和加密存储三者于一体的安全方案,对健康大数据进行全方位的保护。(2)提出适合健康大数据匿名化发布的(α1, α2, α3)-Sensitive K-匿名模型。本文通过深入研究隐私保护技术,特别是经典的K-匿名模型和P-敏感模型的实现原理及其所存在的缺陷,针对性地提出了(α1, α2, α3)-Sensitive K-匿名模型,该模型由专家来设置α1, α2, α3以及K的值,具有安全、灵活的特点,并且可以解决传统K-匿名模型和P-Sensitive模型所无法解决的一致性攻击问题。(3)提出了针对健康大数据特征的存储加密策略。在尽量不影响系统性能的前提下,本文补充性地设计了一种健康大数据加密策略,该策略可以防止开发人员以及数据管理人员查看用户隐私信息,同时还可以在数据库被攻破时对健康大数据提供保护作用。