论文部分内容阅读
随着互联网的快速普及,传统产业与互联网技术迅速融合。“互联网+”以其方便快捷的特点,使得人们的日常活动被越来越多地从“线下”转移到“线上”进行,同时这些活动产生的数据也被记录了下来,形成了一座巨大的“大数据”金矿。然而人们在享受美好生活的同时,也在忍受着个人隐私信息泄露的风险。近年来各类隐私泄露事件层出不穷,特别是“棱镜门”曝光的网络信息安全泄露事件,再一次把隐私保护问题推向了风口浪尖。然而大数据环境下,数据具有种类多、数量大、增长速度快及价值密度低等特点,若对所有的隐私数据都提供相同程度的保护必然会造成计算资源的浪费,而且过度保护也不利于互联网的发展与大数据价值的挖掘,因此实施分级的隐私保护策略必定是未来发展的方向。根据网络安全技术的发展历程,并且考虑到个体对隐私保护的差异性需求、保护过程中的计算与存储开销等,未来的隐私保护方案将会根据隐私保护程度进行分级,较为敏感信息的隐私保护程度较高,而一般隐私信息的保护程度就可以相对降低一些。实施隐私保护分级可以避免“一刀切”这种方式带来的失衡,并且由服务提供之为用户提供更切合实际的隐私保护等级服务。此外,当出现新的隐私保护方案时,分级模型可以作为评判新方法或相应技术下隐私保护程度高低的基准,也可以对各种隐私保护技术的效果进行评价。本文的主要研究工作概括如下:(1)使用CiteSpace文献分析工具对隐私保护技术相关内容做了综述性研究。首先对k-匿名和差分隐私分别从概念与特性等角度进行分析,接着详细概述了这两种技术在图结构隐私保护中的应用。(2)提出了网络度中心性和网络结构熵作为隐私性度量指标。将复杂网络的度分布理论应用到隐私保护领域,通过对星型网络、邻近耦合网络、随机网络、小世界网络以及无标度网络的网络平均度、网络度中心性、网络结构熵和网络平均聚集系数等网络静态特征值,得出结论:网络度中心性和结构熵可以作为隐私性度量指标。(3)提出了一种基于网络度分布特征的隐私分级方案。该方案应用本文所提出的网络度中心性和网络结构熵这两种指标来量化隐私保护程度,选取了邻近耦合网络结构作为隐私保护程度最高的基准网络结构,再结合隐私保护国际标准中的隐私评估模型,以及不同网络结构相对基准网络的隐私度占比等内容,定义了 6级隐私保护框架。(4)提出了一种基于VCG定价机制的差分隐私保护分级方案。差分隐私是目前一种具有严格数学定义的隐私保护模型,其以概率为基础量化了隐私保护效果,为开展隐私分级相关工作奠定了基础。新方案是假设存在隐私保护等级的前提下,提出了分级隐私保护服务模型,它是基于VCG机制与最优匹配相结合的方法,为各级隐私保护服务制定合理的价格以引导用户理性地选择隐私保护服务等级。对应于隐私保护国际标准中的隐私评估模型,运用该方案为六级隐私保护服务制定了相应的价格,该服务模型中的定价机制可以合理地制定每个等级之间的价格,实现了隐私数据分级保护,优化了社会资源的配置。