基于政务数据的隐私保护模型研究

被引量 : 2次 | 上传用户:wekey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在经济全球化和信息化的时代,信息瞬息万变,已经成为社会发展的决定因素。在信息社会中,信息和知识扮演着主要的角色。其中政务信息作为最重要的信息资源,收集、存储、使用和传播大量个人数据,涵盖了全社会信息的80%。为了更好地进行社会管理,提高公共服务质量,政务信息的公开与共享势在必行。随着政务信息的公开透明化,不可避免地将会造成政府、个人的隐私信息的泄露。因此,本文主要研究了现有的K-匿名模型在进行数据匿名化过程中存在的问题。针对这些隐私保护模型存在的问题,考虑匿名后数据可用性问题,提出了基于K-匿名的改进算法,并在此基础之上,形成了基于政务数据的隐私保护模型,解决政务数据在公开的过程中造成的敏感信息泄露问题。由此,经过处理之后的政务数据在公开时,有效保护隐私信息的同时,保证信息的可用性。本文主要完成了以下工作:(1)分析隐私保护数据发布的隐私及攻击类型。首先介绍了隐私保护数据发布过程,分析了数据发布过程中的三种角色,及可能产生隐私泄露的各个环节。接着,对于隐私保护数据发布中的三方面重要内容进行详细了叙述,分别是隐私保护模型、隐私保护方法和信息度量标准。(2)分析K-匿名隐私保护模型及类似模型,主要是(1,K)-匿名、(K,1)-匿名、(K,K)-匿名和K-隐藏模型,深入研究这四类模型在进行数据匿名化过程中存在的问题。在K-隐藏隐私保护模型的基础上,提出了改进模型,通过引入随机化及其他隐私保护策略,在提供同等数据可用性的基础上,更好地保护了用户的隐私信息。最后,在四类数据集上,对比分析改进之后的算法与之前提出的K-匿名保护方法。(3)构建基于政务数据的隐私保护模型。详细介绍模型中三个主要数据处理模块,数据预处理、关联规则分析和数据匿名化处理。通过常用的数据预处理方法来清理缺值的数据记录以及统一同一属性内数值的表现形式等;引入关联规则分析找出数据中非显式属性与敏感属性之间的联系,以更加合理的方式确定数据集的准标识符序列;整合改进的K-隐藏隐私保护算法,并辅以数据集取样和数据集二次验证,确保数据的安全性及保证数据的可用性。最后,通过实验,对比本文提出的隐私保护模型与其他算法处理之后数据集的查询错误率和执行效率,验证本文提出模型的有效性。
其他文献
由于缺乏相关的物态证据,目前对佛山剪纸的起源年代和起源地说法不一。多数研究者认为佛山剪纸源自中原,传之宋代,盛于明清,但均没有完整的论述。分析与剪纸相关的其他民间艺
提出了一种以TiSO4为前驱体的制备锐钛矿型纳米TiO2的液相沉淀法。通过控制适宜的制备条件,可将Ti4+的初始浓度提高到1 5mol·L-1。以丙烯酰胺的光催化降解为模型反应,考察了
以东西伯利亚南部最大碳酸盐岩油气田尤罗伯钦—托霍姆油气田为例,采用地质、地球物理等多种基础资料,在GIS系统支撑下,运用多元信息综合分析方法,从裂缝的成因、发育规律等
分析了常见物流中心设施布置设计方法的不足,针对物流中心这种典型的"类生产"型服务型企业,提出了一种有效兼顾物流成本与作业效率的物流中心设施布置优化设计方法,并在遗传
基于Web3.0的移动社会化媒体发展,品牌与消费者之间的沟通与互动成为新的特点,营销与传播的概念也趋向融合。价值认同成为消费者行为的核心。生产型消费者将自创的内容通过泛
采用金相显微镜、扫描电镜、电子探针和显微硬度计,对爆炸焊接321-15CrMoR复合板结合界面进行了研究,探讨爆炸焊接过程的金属物理学机理。结果表明,界面呈波形;界面附近基体
比例原则作为行政法的基本原则之一,在西方历来被奉为"帝王条款"。它要求行政主体在作出行政行为过程中,尤其在行政执法时,手段和目的应该均衡合理。然而在我国,比例原则在行
本钢通过预处理铁水(0.050%P、≤0.005%S)-150 t转炉高拉碳吹炼的LF(RH)-350 mm×470 mm连铸坯-800 mm棒线连轧机组工艺流程生产GCr15轴承钢。操作结果表明,高枪位条件下的高
乡土树种适应性广、抗逆性强、不易感染病虫害、易于养护管理、能自然繁衍成林。随着国家对生态文明建设的高度重视,乡土树种在城市园林绿化建设中将得到更为广泛的应用。通
本文阐述了毒品的发展的新趋势,以K粉为代表的新型毒品次第出现并泛滥流行。它的出现与它不同与传统毒品的新特点、生产工艺、对它立法的不完善等有着密切的关系。要反思传统