数据负发布方法及其应用研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：hhrs918

【摘要】

：

随着信息技术的飞速发展,人们越来越关注数据发布过程中的隐私保护问题。目前存在的大部分数据发布算法,在保护用户身份隐私的情况下,往往直接暴露原始敏感属性值信息。这样,

【作者】

：

吴林莉

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2016年期

【关键词】

：

隐私保护数据发布信息负表示关联规则

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着信息技术的飞速发展,人们越来越关注数据发布过程中的隐私保护问题。目前存在的大部分数据发布算法,在保护用户身份隐私的情况下,往往直接暴露原始敏感属性值信息。这样,如果攻击者使用一些攻击手段,可从发布数据中获取到用户的敏感属性值信息而造成一定程度的隐私泄露。信息负表示借鉴生物免疫系统的自我-非自我学说,是一种新型的隐私保护方法。目前已有相关研究将信息负表示应用于数据发布领域,形成了新的数据发布方法,我们称之为数据负发布。本文针对已有数据负发布方法中存在的缺陷,提出了两种数据负发布方法SvdNPD和(k,p,l)-NPD,并开展了相关的应用研究。本文工作主要包括以下3个方面。(1)提出了基于敏感属性值分布的数据负发布方法SvdNPD。已存在的数据负发布方法(k,m)-anonNPD和(l, m)-divNPD对敏感属性进行聚合查询时,通过提高m来降低误差,这使得存储空间增大。本文将用户敏感属性值分布纳入考虑范围内,在l-多样性模型的基础上,对敏感属性进行负表示时,将负表示选择概率修改为根据用户敏感属性值分布计算出的选择概率,从而获得最终发布表。SvdNPD可直接对发布出的敏感属性信息进行聚合查询,相较于(l, 1)-divNPD具有更好的聚合查询效果。(2)提出了基于准标识符信息负表示的数据发布方法(k, p,l)-NPD。(k, m)-anonNPD和(l, m)-divNPD数据负发布算法在实现k-匿名和l-多样性模型时采用的是抽象匿名技术,需要对每个准标识符属性建立抽象树,将属性值按照抽象树抽象成区间值以达到匿名效果,因而不便从发布数据中挖掘出关联规则。(k,p,l)-NPD无需建立抽象树对属性值进行抽象,而是选取合适的准标识符属性进行负表示来隐藏用户身份信息,对敏感属性进行分组并在组内进行负表示来实现l-多样性模型。因此,(k, p, l)-NPD数据负发布方法在防止攻击者获取用户身份信息的同时,可有效防止敏感信息泄露,且产生的发布数据便于进行关联规则挖掘。(3)提出了基于(k,p,l)-NPD发布表的关联规则挖掘方法NPD-AR。本文针对(k,p,l)-NPD数据负发布方法设计出了关联规则挖掘方法,并通过实验比较从发布表和从原始处理表中挖掘出的关联规则。实验结果表明,NPD-AR可挖掘出效果很好的关联规则,且适当的提高支持度阈值和置信度阈值可降低关联规则的误报率和漏报率。本文工作不仅在面向隐私保护的数据发布方法研究方面具有参考价值,而且对基于隐私保护的数据发布表进行数据挖掘方面具有参考价值。

其他文献

基于J2EE的物料管理系统的设计与实现

随着市场经济不断发展,企业间多元化竞争日趋激烈,企业想在激烈的竞争中处于不败之地,就必须考虑如何降低传统成本。而采购、库存、生产配比等环节是大多数企业,尤其是生产装

学位

物料管理系统J2EEAjaxStrutsHibernate

面向任务的服务发现和自适应服务组合机制研究

本文研究题目来源于国家“十一五”科技支撑计划课题“勘察设计企业信息化关键技术研究与应用”子课题“基于SOA技术的勘探设计企业应用软件架构系统”。　　在Web服务环境中

学位

任务规划服务发现自适应服务组合机制全局发现算法局部更新算法

基于D-S证据理论的多模型网络安全态势预测研究

随着信息技术的不断发展,网络的不安全因素也随之增加。虽然传统的安全设备和安全检测方法得到了广泛的应用,但都没有从宏观的角度为网络管理员提供清晰的网络安全状态信息。

学位

网络安全态势感知态势预测D-S证据理论组合预测

基于多机多卡的卷积神经网络性能优化

随着深度学习在各个领域的普及,神经网络参数的规模越来越大,训练的周期也越来越长,多GPU加速成了必然的硬件解决方案。为了最大化多GPU的硬件利用率,本文研究和实现了深度学

学位

Purine多机多卡深度学习负载均衡

基于ARM体系结构的上层应用——音频编解码协议G.729.1的优化及应用

语音编解码协议是语音在网络上传输的重要因素之一,高质量的语音编解码算法又是协议的精髓所在,而且低速率的语音编码器节省了大量的带宽,因此一个性能卓越的算法不仅能够提

学位

语音编解码G.729.1优化ARM

混合结构化P2P网络中高效资源发现算法的研究

P2P (Peer to Peer)网络模型凭借其低廉的部署费用和丰富的共享资源等优势,迅速地在互联网上流行起来。P2P网络中完全地抛开了服务器的存在,资源分布地存储在整个网络当中,因

学位

混合结构化对等网络资源发现超级节点物理位置感知

基于语义的个性化信息检索研究

网络信息资源的极大丰富和无序使得信息检索成为当今信息领域的热点问题,而个性化信息检索的需求也日益迫切了。虽然已经存在一些个性化信息检索系统,但是它们使用的是传统的

学位

语义匹配web日志挖掘本体信息检索

基于内容图像数据库检索的技术研究

传统的基于文本的检索方法是对图像数据库中的每一幅图像进行关键字描述,根据关键字对用户给定的图像进行检索,基于内容的图像检索是使用图像的颜色、纹理和形状图像内容,建

学位

图像检索像素相关颜色直方图LBP纹理灰度共生矩阵统计纹理

Unbound域名系统软件的性能优化及安全性分析

随着信息技术的进步和计算机技术的广泛引用,互联网已经渗透至社会生活的各个角落,网络环境日益复杂,网路变得更加繁忙,互联网基础设施承受着更大的压力。但网络基础设施本身

学位

DNS性能优化服务器选择算法AR(1)生日悖论攻击DDoS攻击网络安全

面向BWDSP的SIMD编译优化技术研究与实现

BWDSP是一款采用分簇体系结构、支持SIMD的16发射的VLIW浮点运算数字信号处理器。由于其具有强大的并行处理能力,能够较好得满足实时信号处理的要求,被广泛应用于各种高性能

学位

BWDSP指令级并行SIMD编译优化单指令多数据流超长指令字

数据负发布方法及其应用研究

与本文相关的学术论文