论文部分内容阅读
信息技术和网络技术的发展使得越来越多的信息被制造、收集和传播,于是产生了信息爆炸和信息全球化。然而,全球范围内的信息爆炸以及信息全球化,为人们所带来的不仅仅是因信息高度共享而产生的便利,也随之带来了隐私保护的难题。因为传统的数据挖掘技术在对数据进行处理从而发现知识的同时,将会对数据中隐私信息的安全造成威胁。可见,信息化的普及和隐私安全的保护已经成为了一对可能长期存在的矛盾体,并且伴随着信息系统网络化而日益严重。怎样在充分利用因信息共享而产生的便利为人们的工作、生活服务的同时,保证人们的隐私安全和相关权益,已经是信息技术领域中,一个摆在全人类面前无法回避的、迫切需要解决的重大问题,尤其是在人权越来越被重视的今天。正因为如此,数据挖掘的隐私保护相关研究越来越受到研究者的广泛关注。至今为止,已有许多学者对此做出研究并取得了一定的研究成果。但是,相关研究中大多数是假设目标数据集是静态的,而现实生活中所涉及到的真实数据集往往不但并非静止不变,反而变化形式多样且变化迅速频繁,以至于少数的一些针对动态数据集设计的隐私保护方法也因为对这两个特点的支持度不够而不能够很好的满足现实需求。因此,相关研究还有待完善。本文研究的主要目标就是要构建基于动态数据集的隐私保护模型和实现对动态数据集的匿名重发布,从而保护数据中隐私信息的安全。本文深入分析了现有的基于限制发布的隐私保护技术,结合目前典型的适用于静态数据集和准动态数据集的隐私保护模型,在改进与完善其缺陷和不足的基础上,构建了有效的基于动态数据集的全敏感属性匿名模型,并且根据该匿名模型,制定了相应的动态更新规则,据此设计并实现了基于动态数据集的匿名重发布系统。然后,通过该系统进行实验,验证了本文所设计的方法不仅可以大幅降低计算开销,同时能够保证较高的数据完整性和真实性。