数据共享与发布中的隐私保护方法研究

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:chichilela
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是信息化高度发展的时代,各种数据不仅充斥着普通人的日常生活,更是被广泛应用于各行各业,为行业乃至社会的高效运行、发展提供源源不断的动力。数据的共享为数据提供了流动的渠道,提高了数据的利用率。在数据的共享过程中,直接发布这些数据存在泄露用户隐私的风险,所以如何高效安全的实现数据共享一直都是人们高度关注的话题,同时也是一项有难度的工作。在过去十年中,许多学者对数据共享和数据发布中的隐私保护进行了大量的研究,其中对于数据发布的处理方式是通过传统的匿名化隐私保护技术,然而当前的许多方案中仍然有泄露用户隐私的风险。针对这个问题,本文提出了基于差分隐私的满足数据发布应用要求的编码方案,通过相应的理论和实验证明本文所提出的方案进一步的提高了用户的隐私保护。本论文主体内容分为三个方面:1)比特向量编码方案介绍及改进,2)基于比特向量的记录链接分组问题,3)基于比特向量的直方图发布。其中,比特向量编码方案介绍及改进中首先对比特向量编码方案进行了详细的介绍,随之提出了一种改进后的比特向量编码方案(IBV),使其相对原编码方案(BV)具有更低的最大误差。同时基于IBV方案中随机数泄露导致的隐私问题,提出了基于差分隐私改进的比特向量编码方案(DPIBV)。通过距离估计的有效性实验证明了本文提出的IBV方案相比BV具有更低的最坏误差。在基于比特向量的记录链接分组问题中,研究了BV方案与IBV方案在记录链接问题上的表现。对于加速记录链接在实际运用中的效率问题,基于二叉树的思想提出了数据的分组方案,该方案能有效地在不降低记录链接效果的情况下提高记录链接的效率。通过记录链接实验,在相同的修正因子下,改进的比特向量技术拥有更高的准确率、召回率和fscore。通过分组实验,验证了在分组方案在效率和准确性方面的优势。最后,在基于比特向量的直方图发布中,本文将BV方案应用在直方图发布和均值发布的场景中,使其满足保护用户隐私的发布要求。同时基于差分隐私的编码方案提出了匿名空间中用于数据发布的算法。通过实验得到了以下结论:在BV和IBV编码方案的直方图发布中,不同数据量下IBV方案的编码误差更小;数据量越大时,基于差分隐私的比特向量编码方案直方图估计越准确;隐私参数epsilon越大,均值估计和直方图估计的估计误差越小。
其他文献
目的通过检测原发性肾病综合征(PNS)患者尿中性粒细胞明胶酶相关脂质运载蛋白(NGAL),探讨其与肾小管间质病理损伤的关系。方法以2017年3月至2018年7月确诊为PNS并行肾穿刺活
通过对1例侵蚀性葡萄胎化疗患者进行心理护理、口腔炎护理、腹泻护理、骨髓抑制护理、静脉炎护理,并遵医嘱给予药物治疗,强化健康教育指导,做好出院指导等措施,患者化疗后出
经实证法语料分析发现,由于认知、心理、语言接触等原因,"然后"一词在现代汉语自然会话中,新生有继续话题、转换话题、开启话轮、开启话题四种话语功能.同时,"然后"作为连词的语
电力线载波通信以分布广泛的低压电力传输线为通信媒介,它的便利性无可取代。同时,它也被认为是智能电网中举足轻重的一种通信方式。然而,整个电力线通信网络共享一个信道,导
<正>儿童是图书馆服务的特殊人群,无论是服务方式、服务内容还是服务对象,图书馆为儿童的服务都在逐渐深入和细化。本专题是我们团队继去年"儿童阅读推广研究"之后,又一组研
随着智能化住宅、智能化酒店、智能化小区的普及,我国人民在享受着智能化保障安全、为生活提供便利的同时,也面临着许多问题,如构造智能化弱电系统的材料不耐用、子系统管理
该文分析了大型精密贵重仪器培训体系中存在的问题.通过在现有大型仪器设备开放共享系统基础上增加精细的培训需求管理、有针对性的培训方案设计、标准的培训实施流程、多元
在对关系数据库业务模型分析的基础上采用报表工具,通过建立维度间的层次关系对业务数据进行不同维度的挖掘、切片与钻取统计。并结合基于Flex的Rich-Client的图形功能提供丰
目的比较研究噬菌体裂解法、涂片法、BACTALERT 3D培养法(以下简称培养法)对肺结核病的诊断应用价值。方法选取新入院患者129例,应用噬菌体裂解法、涂片法、培养法对其痰标本进
1研究背景在临床上,急性肺损伤/急性呼吸窘迫综合征(acute lung injury, ALI/acute respiratory distress syndrome, ARDS)是一种常见危重疾病,其病死率在我国仍居高不下,高