隐私保护中匿名技术的研究与改进

来源 :重庆大学 | 被引量 : 0次 | 上传用户:guihuxinxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息化高速发展的今天,数据的高度收集和共享给人类带来了极大的便利。但是,随着数据仓库和数据挖掘技术的成熟,大量的隐私信息也被置于极为尴尬的境地。作为一种数据发布阶段的隐私保护技术,K-匿名因为其思想简单且易于实现,得到了广泛的关注和应用。但是,由于K-匿名本身存在的一些问题,严重地制约了它的继续发展。本文通过对K-匿名模型的综合分析后,指出K-匿名模型的不足之处,并提出了一种新的改进模型--(L,K)-匿名模型,该模型能够有效应对K-匿名模型的不足。本文还在(L,K)-匿名模型中引入了“伪记录”的思想,使得(L,K)-匿名模型也可以应用到数据的重发布中。本文的主要工作包括:   ①针对现有K-匿名实现方法灵活性差,信息损失较大的问题,本文给出了一种基于聚类思想的简单有效的算法和符合聚类算法特点的信息损失度量方法。该算法能较好的在保护隐私和保证数据有效性之间取得平衡,而改进后的信息损失度量方法也可以更准确地对匿名策略进行评估。   ②分析了K-匿名模型及其改进模型的优点和不足。针对K-匿名模型不能有效防止属性泄露且不能很好地实现隐私自治的问题,本文将K-匿名模型改进为(L,K)-匿名模型。通过引入敏感属性值敏感度S为不同敏感度的敏感属性值提供不同的保护强度,同时通过预设的等价组敏感度阈值L,对发布数据做进一步的约束,从而很好的实现了隐私自治并能有效的防止属性泄露,增强了数据发布的安全性。   ③分析了数据重发布过程中存在的隐私泄露问题,然后将“伪记录”的思想引入到(L,K)-匿名模型中。在此基础上,本文提出了一种基于“M-恒定”的支持数据重发布的策略并给出了实现算法,使得(L,K)-匿名模型更符合实际的要求。   ④利用加利福尼亚大学机器学习中心的Adult数据集对本文提出的模型和数据重发布策略进行了多方面的验证。实验不仅验证了(L,K)-匿名和“M-恒定”算法的正确性及有效性,而且表明符合这两种策略要求的数据表,不但可以有效防止隐私泄露,其数据精确度也可以达到较高水平。
其他文献
随着现代军事技术的不断发展和需要,计算机在军事领域的应用越来越多,但日趋复杂的战场电磁环境却对它们的安全运行构成了严重威协。为了使计算机能够在日趋复杂的战场电磁环
“道听途说”是个贬意词,特别是对新闻报道似乎是一个大忌。但我认为,作为热爱和有志于新闻工作的通讯员来说,却不失为获得新闻报道线索的一种途径。近几年,我所采写的新闻
上蔡县东洪乡教师王立业来信问:具备什么条件,才能当新闻单位的通讯员?能发给通讯员证吗?对通讯员写的稿件会不会优先采用? 王立业同志: 社会主义新闻事业是党和政府的喉舌,
一、实验方法本实验采用的方法为原子吸收分光光度法.原子吸收分光光度法需要将试样转变成溶液,但是鱼体器官不能直接溶于一般的溶剂中,需要预处理使试样变成溶液形式.首先需
随着Internet和WWW的流行,以往的主机/终端和C/S都无法满足当前的全球网络开放、互连、信息随处可见和信息共享的新要求,于是就出现了B/S模式,即浏览器/服务器模式。B/S模式
对于具有重复运动性质的被控系统,迭代学习控制技术是一种简单有效的控制方法。迭代学习控制的基本思想是基于输出信号与给定目标轨迹的偏差不断修正不理想的控制输入信号,实
进化算法是一类借鉴生物界自然选择和自然遗传机制的随机化搜索算法,其主要特点是群体搜索策略和群体中个体之间的信息交换,搜索不依赖于梯度信息。它尤其适用于处理传统搜索方
在高中阶段,化学学科在课程教学中占据着重要地位.化学学科的重要特征是理论与实验的结合.在化学教学过程中,教师需要采取科学的方法进行教学,激发学生学习兴趣,培养学生创新
学源于思,思源于疑.在高中化学教学中,师要让学生更加主动地通过探究来实现构建化学知识,单纯地讲授效果不会很好,而借助问题,以问题来启发引导学生思考,通过引导学生解决问
我原在某师搞过10多年的新闻报道。1979年到地方改做秘书工作(现任河南省冶金建材厅办公室副主任),对老行仍有浓厚的兴趣,经常在当地报刊发表点文章。党的十一届三中全会以