基于差分隐私的直方图发布技术的研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:dsvs123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字化的快速发展,世界各地每天都产生着大量的信息,其中的信息有很大一部分包含着敏感信息,如医院的患病信息等。这些信息具有极大的科研价值,例如可以通过各个地方医院的患病信息推断出流行病的走势等,但是直接发布这些信息会泄露隐私。所以如何有效的利用这些资源的同时保护用户的隐私是一项艰难的工作。差分隐私是一种具有强大隐私保护功能的机制,差分隐私通过向数据注入随机噪音的方式来保证隐私,通过使用差分隐私的保护机制会使得攻击者很难推断一个单独的数据记录是否存在于数据库当中。目前差分隐私已经应用到了许多领域,如直方图发布,批量查询,top-k数据挖掘,线性回归,分类器等领域。由于差分隐私通过添加噪音的方式来对隐私进行保护,使得数据的有效性受到了影响,所以现在算法的优化目标就是在保证原有的隐私保护之上尽量使得误差得到减少,从而提高数据的可用性。直方图发布技术由于其在数据统计领域被广泛的应用,所以成为现在差分隐私的研究热点,对于直方图优化技术来说目前最主要的优化方式是通过对原有的直方图进行合并,然后再针对合并之后的数据进行添加拉普拉斯随机噪音,然而由于之前的算法设计的不够完善导致其算法的敏感度过高,使得降噪的效果始终并不是很好。本文针对现有的直方图发布技术进行了深入的研究,并对各个直方图发布算法进行了分析,针对现在算法所存在一些缺陷,挖掘出该缺陷的主要原因,并提出了改进的算法。鉴于现有的直方图发布算法主要分为数据划分算法与数据加噪算法两部分,本文主要针对数据划分算法进行优化。对于数据划分算法,不同于之前的算法将整体的数据一次性划分的思路,本文将划分算法分为两步,第一步是将整体的数据划分成两个子部分,第二步是将第一步得到的两个子部分进一步进行划分,如此划分的优点在于可以有效的降低划分算法的敏感度,从而提高划分的质量,最终使得结果得到优化。本文充分的实验证明本文提出的算法相对于现有的优化算法来说进一步降低了误差。
其他文献
随着对Web服务技术研究的不断深入,为了实现智能化的Web服务提供,出现了语义Web服务。语义Web服务是Web服务和语义Web结合的产物,它的目标是通过对Web服务进行语义描述,使其成为
Petri网是一种形式化、图形化的系统建模、描述和分析工具。对于具有异步并发、分布、不确定性和随机性的系统,都可以利用这种工具构建模型,然后对其进行分析,即可得到系统静
在计算机软件的开发过程中,变更是不可避免并频繁发生的。频繁复杂的变更极易导致项目开发的混乱,影响项目开发的进度和交付成果的质量。软件配置管理贯穿计算机软件的整个生
IPTV(交互式网络电视)是互联网与传统电视相融合的结果,对于用户来说,它最大的意义在于开辟了一种全新的娱乐方式,而对于电信运营商来说,它既促进了宽带接入业务的发展,又在增加了
目前,机器学习型文本分类算法在面向主题搜索引擎领域的应用已十分广泛,但由于其存在“一次性学习”问题,严重制约了其在综合搜索引擎领域的应用。所谓“一次性学习”,就是指
配电环节是连接供电部门和用户的重要纽带,在整个电力系统中起着至关重要的作用。为了提高供电质量,最大限度地满足国民经济发展和社会用电需求,国家电力总公司已明确提出,要
随着时代和经济的发展,汽车已不再是高官贵族们所独有的。当今社会,汽车已成为一种普及的代步工具。在汽车的使用过程中,我们往往会碰到倒车时出现盲区导致汽车被刮蹭等问题
随着计算机软件深入到生活的方方面面,人们对计算机软件质量的要求不断提高。软件测试技术作为一种有效的软件质量保证手段,已成为软件开发过程中必不可少的环节。在软件开发过
随着网络时代的发展,网络信息爆炸性增长,相关机构是否能快速准确地判断网络信息的情感倾向性,是否能对网络舆情及时地采取应对措施,让网络能够朝着健康的方向发展。在军事领
钻孔压水试验是一种在钻孔内进行的岩石渗透性测定试验,是测定岩石渗透性最常用的一种试验方法,该试验被广泛应用于水利水电,铁路,矿山,水洞的地质勘察和地质灾害的防治等领域。目