一种基于隐私保护的全局最优模型

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:melancholy111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据持有者经常需要将数据库对外发布以供研究或其它用途,而发布的数据中往往会包含有大量个体的隐私信息。在正常情况下这些发布的数据会被合理使用,但是与此同时这些数据也可以被恶意攻击者获取。为了防止攻击者从发布的数据中提取出个体的隐私信息,数据持有者需要在发布数据之前对数据进行匿名和模糊化处理。连接攻击是攻击者获取个体隐私数据的一种常用手段。随着如今信息规模的扩大和大数据技术的发展,攻击者对数据的获取能力和分析能力在不断提高。在一般情况下,对于数据持有者发布的单个匿名数据表,攻击者很难分析出某个个体的隐私信息。但是当攻击者将从多个渠道获取的匿名数据表、个体的背景信息和自身数据库连接在一起时就很有可能推测出个体的隐私信息。上述的攻击方式即连接攻击,这是隐私保护领域中一个比较棘手的问题。对于连接攻击,Sweeney首次提出用于保护隐私数据安全的κ-匿名算法,在这之后很多学者在κ-匿名算法的的框架下进行了改进,然而现有的算法并没有达到最佳的匿名效果。一个高效的匿名算法应当能够很好地解决一个基本矛盾,即准确性与安全性之前的权衡问题。对于不同匿名程度的数据表,当数据准确性性提高时,数据的安全性就会降低,反之亦然。本论文以此为出发点提出了一种新的匿名算法称为(d,q)-计划分算法,其中包括以下研究成果:(1)本论文首先基于古典概型理论对基本矛盾进行量化并建立了一个新的数量标准。这一数量标准衡量了一个个体发生隐私泄露的可能性大小,同时衡量了全局安全性与全局准确性的程度。(2)基于新的数量标准,本论文推导出一个最优划分理论。这一理论使得我们可以在最小程度上损失全局安全性的情况下最大程度地获取全局准确性,从而达到准确性与安全性之间的最优权衡。(3)在最优划分理论的前提下,本论文设定(d,q)参数标准,通过控制d和q的取值,我们可以根据需求控制安全性与准确性之间的权衡。(4)本论文引入了多维空间和空间划分的概念,并在此基础上提出可重合区间划分方法。这一方法有助于保证数据保护的准确性和安全性之间的最优平衡,并使得多维空间划分可以适应最优划分理论。
其他文献
PPP模式是由政府部门和社会资本通过合作来进行建设和运营基础设施项目的一种模式。随着社会的发展和进步,城市化进程逐步加快,基础设施建设的速度已经不能满足当前社会公众
无线传感器网络需要面临各种各样的安全威胁,如节点暴露在不安全的环境中时易被俘获;采.用无线电信号传播时易被截获等。因此网络安全问题是无线传感器网络中的一个重要研究
随着无线网络和多媒体技术的迅速发展,人们将视频、音频、图像等多媒体信息引入到了传统的无线传感器网络中,用来实现对监控环境的细粒度、精准的监测。无线多媒体传感器网络
随着互联网技术的快速发展,互联网应用的种类也日渐多样化。在生活中用户通常使用搜索引擎实现对名人、明星等特定人脸图像的获取。但传统的基于文本的图像检索具有检索方式
自电致变色效应第一次被报道以来,在这几十年里,电致变色效应得到了很多的研究,很多电致变色材料被陆续发现和研究,各种各样的电致变色器件也被发明和研究,应用到科研、军工
车牌筛选可以看做是一种对车牌识别的预处理过程。通过筛选出能够被识别的车牌图像,以及分析不能够识别的图像,修正车牌图像采集系统误差,来达到提高车牌识别准确率的目的。
随着微电子、嵌入式和通信等技术的发展,无线传感器网络以其无限应用前景得到了广泛关注。由于硬件设备、通信质量和周围环境等因素的影响,传感器节点所采集的感知数据具有不
图像特征提取是图像识别及机器视觉应用的关键,快速、准确提取图像特征是图像处理的首要任务。而传统的图像处理技术不够完善,存在由于特征提取算法的计算量巨大而导致整个系
集成电路(integrated circuit,IC)测试是IC产品制造过程中不可缺少的环节。它既要保证IC芯片的正确逻辑,又要保证IC芯片在规定的时间内做出正确的响应。随着IC系统工作频率的
在大数据时代,我们每天都会有数以万计的信息急需处理。作为一种直观的信息表达方式,图像早已普遍应用到各行各业中。如何快速且高效地实现图像分类是值得探究的热点问题之一