动态集值属性数据重发布的隐私保护研究

来源 :北京工业大学 | 被引量 : 3次 | 上传用户：jwliangbo

【摘要】

：

随着计算机、数据库和网络信息技术的蓬勃发展及广泛应用，越来越多的数据在网络中被公开发布。数据挖掘等诸多技术的进步帮助了人们有效地利用发布数据，从海量信息中抽取出潜在

【作者】

：

武毅

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2013年01期

【关键词】

：

隐私保护集值属性数据动态数据集重发布 k-preserving原则

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机、数据库和网络信息技术的蓬勃发展及广泛应用，越来越多的数据在网络中被公开发布。数据挖掘等诸多技术的进步帮助了人们有效地利用发布数据，从海量信息中抽取出潜在的、有价值的知识，同时也推动了数据发布技术的发展。然而发布数据中可能包含的大量个人隐私和敏感信息也面临隐私泄露的威胁，因此数据发布中的隐私保护研究具有重要的作用和意义。集值属性数据是一种主要的发布数据类型；真实的数据发布应用中，又包含对数据集的增加、删除和修改等动态操作，需要进行更新和重新发布。本文以动态集值属性数据的重发布为研究对象，针对一般形式的动态集值属性数据重发布的需求，对如何实施有效的隐私保护，高效地完成匿名发布处理，并更好保留发布结果的信息完整性和实用性问题进行了相关研究。针对动态集值属性数据重发布中的隐私保护问题，本文提出并设计了一个动态集值属性数据重发布的隐私保护模型。该模型将数据的收集更新、隐私保护方案、匿名处理和数据发布部分相结合，构成了一个有机整体，达到了对动态变化的集值属性数据集的重发布实施隐私保护的目的。针对现有集值属性数据匿名隐私保护方法存在的问题，本文提出并设计了一个改进的集值属性数据k-anonymity匿名算法。通过结合局部重编码泛化和隐匿技术，扩展了基于自顶向下划分的泛化算法，使用多轮次、两阶段的方式对集值属性数据进行泛化和隐匿处理，有效降低了匿名结果的信息损失。本文补充并提出了完整的匿名结果质量度量标准以验证匿名结果的质量得到提升，为重发布方法的研究提供了基础。针对动态集值属性数据的重发布问题，本文基于扩展的适用于集值属性数据的敏感属性更新图原理，提出了k-preserving隐私保护原则。延续使用事务型k-anonymity原则对单次匿名发布实施保护，并通过维持敏感元素在更新重发布中的多样性和连续性阻止其被攻击揭露。结合改进的k-anonymity匿名算法，提出了相应的完整动态集值属性数据重发布算法，该算法也是本文提出模型的核心内容。在以上研究的基础上，本文对所提出的模型进行了实现，并使用真实数据集分别对模型中的核心算法和重发布方法实施进行了实验。结果表明了该模型达到了隐私保护和提高发布数据质量的目标，具有很好的实用性和有效性。

其他文献

量子图像信息隐藏及几何变换技术研究

所谓“眼见为实”，通过观察一幅图像，人们可以对事物的外观信息和由其呈现出的事物性质得以直观和真切地把握。由于量子计算机的性能较之经典计算机有着本质的飞跃，以及量子计算

学位

量子图像信息隐藏几何变换图像处理算法

扩展的动态逻辑程序及其在产品信息个性化推荐中的应用

当前，回答集程序设计已经成为人工智能领域知识表示和推理的重要工具。它是一种描述性的问题解决框架，非常适用于对涉及常识推理的问题进行建模，并自动求解。动态逻辑程序是回答

学位

扩展的动态逻辑程序最优回答集个性化推荐

基于部分求值和热踪编译的Twig查询优化方法

由于互联网技术的快速发展,我们可以通过它来发布和获取各式各样的信息。所以,为了充分且有效地表示网络上丰富的数据,W3C组织提出了将XML作为互联网上信息共享的格式。XML由

学位

XMLTwigTreeMatch部分求值热踪编译

基于K-means和神经网络算法的图像文字提取与识别

近年来,随着数字化技术、信息化技术以及多媒体技术的迅速发展,有大量的数字图像、遥感图像、广告图像、路标指示牌以及微博(web)中的图像充斥着我们的生活。而这些图像中包

学位

文字提取图像处理神经网络文字识别

基于卷积神经网络的多部位人体检测

人体检测的目的是识别出图像中的人体并给出其定位信息。人体检测技术在运动分析、智能监控以及驾驶辅助系统等领域有着广泛的应用,是物体检测的一个研究热点。R-CNN(Regions

学位

多部位人体检测卷积神经网络R-CNN高斯混合模型K近邻

基于路径特征的复杂本体匹配学习

本体是实现语义网的关键组成部分，是对领域知识的一种形式化表达。它用来标注语义网络上的网页、数据等资源，目的在于支持应用系统的语义集成和互操作。近年来，本体的数量快速增

学位

复杂本体匹配链接开放数据路径特征匹配模式联合学习

基于仿真建模的工业控制网络异常检测方法研究

随着工业控制网络朝着生产高度数字化、网络化、机器自组织的方向发展。在生产效率提高的同时,越来越多的安全风险和安全漏洞被暴露出来。尤其在工业控制网络层,作为工业控制

学位

仿真编译原理系统辨识异常检测

无线多跳网络路由协议研究及应用

步入21世纪以来,移动无线通信技术以及智能终端技术得到迅速发展,人们对更便捷、更高效、更高容量的无线网络的要求不断提高。无线多跳网络(无线Ad Hoc网络、无线mesh网络、

学位

无线多跳网络LinuxAODV邻居节点筛选hello-ack

基于Flex和Java技术的基层量化考评管理系统的设计和实现

随着军队及通信台站装备技术、管理理念和管理方法的不断发展,目前所实行的各类法规制度逐渐暴露出一些缺陷,如缺少人员管理指标及量化标准等、缺乏过程监管、缺乏评估手段、缺乏信息化平台,等等。因此,建立一套以信息网络为支撑,结构一体、数据共享的综合管理体系非常必要。本文旨在通过分析目前台站所面临的管理问题及衍生出来的实际需求,给出一种基于B/S结构的基层台站量化考评管理系统。该系统以现有的法规制度为依据,

学位

量化考评360度考评指标体系RIA Flex Java LCDS

基于搜索引擎的中文自动问答系统的设计与实现

我们处于一个信息极其丰富的时代,人们对于快速准确地获取信息产生极大的需求。搜索引擎以其使用方便、反应迅捷而备受人们欢迎,成为信息获取的最主要方式。然而搜索引擎以关

学位

问答系统Site Q多特征融合语义依存树答案抽取

动态集值属性数据重发布的隐私保护研究

与本文相关的学术论文