基于差分隐私的精确直方图发布算法的设计与实现

来源 :贵州大学 | 被引量 : 0次 | 上传用户：yufs80131234

【摘要】

：

【作者】

：

张浩铭

【出处】

：

贵州大学

【发表日期】

：

2019年01期

【关键词】

：

直方图差分隐私动态规划

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

直方图是数字数据分布的精确图形表示,广泛用于数据发布、数据挖掘和分析。然而,如果我们直接使用原始数据来发布直方图,这似乎存在隐私漏洞。差分隐私(DP)作为一种数学定义,是在数据库中发布汇总数据统计查询的理想解决方案,能够抵御任意背景知识的攻击者并提供了强大的隐私保护保障。本文研究了基于差分隐私的精确直方图发布算法。本文的主要目的是通过确保发布算法满足差分隐私的同时,提高发布直方图的精度。本文首先分析了V-优化直方图变体算法——噪声优先算法(NoiseFirst)和结构优先算法(StructureFirst)。然后通过复原算法并实验,对其进行了深入研究,并指出了这些算法中存在的问题和不足。为了解决这些问题,本文提出了如下优化及解决方法。其次,本文提出了一种优化结构下的算法(Optimization Structure Algorithm,OSA)。该算法首先通过近似最优的解决方案将隐私预算分成两部分,然后执行迭代的动态规划(Dynamic Programming)算法来获得最优的分组结构,因此新生成的直方图拥有最小的分组误差。然后,通过使用优化的指数机制来保护最优结构的隐私,并计算每个分组的均值。最后,为每个分组的均值添加拉普拉斯噪声并发布最优的直方图。在真实的数据集上,OSA与现有的算法Boost进行实验比对,通过实验结果表明,OSA超越了Boost算法,并达到了更好的效用。再次,本文设计了一种新的直方图发布机制(Optimal Mechanism,OM),可以在满足差分隐私的同时发布更准确的直方图。首先,本文采用随机快速排序算法(Randomized quicksort Algorithm,RA)对注入拉普拉斯噪声的直方图进行排序,以便降低误差。RA法能够有效抵抗已知排序算法并利用特定数据进行恶意攻击的敌手。这也是本文使用该算法的原因。此外,在分组问题上,本文提出并设计了基于动态规划思想的最小误差权重的解决方案(Dynamic Programming based on Error Weights,DPEW),以进一步提高所发布的直方图的准确性。最后,本文使用两个真实数据集提供详细的实验评估分析,其数据范围从数千到数百万条记录不等。这些数据集来自互联网上的各种领域(例如,巴西的IPUMS人口普查,希拉里克林顿和唐纳德特朗普的推文)。本文的结果给出了算法实验数据比对,并证实了本论文设计实现的机制优于其他同类方法,验证了算法将产生更小的误差,并大大提高了直方图上范围查询的准确性。

其他文献

丙戊酸对人卵巢癌A2780细胞生长及血管生成和转移相关因子表达影响的研究

目的研究丙戊酸(VPA)对人卵巢癌A2780细胞生长及血管生成和转移相关因子(VEGF、MMP-9、MMP-2、E-cadherin)表达的影响。方法用不同浓度(0、1、2、3、4、5mmol／L)的VPA处

学位

卵巢肿瘤丙戊酸血管内皮生长因子(VEGF)基质金属蛋白酶(MMP-9、MMP-2)钙黏附蛋白(E-cadherin)

汉文化对高句丽文化的影响

本文从生产方式、思想意识、文学艺术、风俗习惯、政治制度、文化教育等方面阐述了高句丽文化中的汉文化因素。通过高句丽民族在不同时期、不同侧面对汉文化承袭的诸多特征,

期刊

汉文化高句丽影响

基于双目视觉的塔机障碍物测距方法研究

塔式起重机是目前建筑工地中常用的施工设备,由于工作环境复杂,极易发生碰撞事故,一旦发生事故往往会造成严重的经济损失和人员伤亡。如何避免施工过程中塔机之间以及塔机与

学位

塔机双目视觉摄像机标定特征匹配测距

siRNA沉默PC3细胞中KDR基因表达的实验研究

血管内皮生长因子受体-2(Vascular endothelial growth factor receptor-2/kinase-insert domain containing receptor：VEGFR-2／KDR)广泛分布于血管内皮细胞，也分布于部分肿瘤细

学位

基因治疗KDRRNAipSileneer3.1-H1 neo

鄂尔多斯盆地盒8段气藏烃类检测技术研究

鄂尔多斯盆地上古生界盒8段气藏属典型的低孔低渗的砂岩岩性气藏,受沉积环境的影响,盒8段储层在盆地中较为发育,但储层段物性及含气性在横向上存在着严重的非均质性[1].因此,

期刊

鄂尔多斯盆地晚古生代地质模型数学模型AVO烃类检测

限制性饮食者的注意偏向、情感评定及进食行为的关系研究

为确定限制性饮食者的注意偏向、情感评定与进食行为之间的关系,本研究通过三个实验分别考察限制性饮食者注意偏向、情感评定及进食行为的特点,并综合分析三者之间的关系。使

学位

限制性饮食者注意偏向情感评定进食行为

ERCP术前护理干预的作用

<正>宁波市镇海区人民医院于2012年3月开始实行对拟行内镜下逆行性胰胆管造影术(ERCP)手术的患者进行手术前探访、宣教及术中、术后护理干预,结果显示这对解除患者术前紧张情

期刊

护理内镜狭隘逆行胰胆管造影术胰胆管狭窄

基于高通量测序和降解组测序的野生大麦miRNA的鉴定与分析

野生大麦(Hordeum spontaneum)作为栽培大麦(Hordeum vulgare)的祖先,有着极强的生态适应能力,可在高纬度,高海拔,恶劣气候,贫瘠土壤等环境中生存。野生大麦具有广泛的遗传基

学位

miRNAmiRNA测序降解组测序qPCR

探究新时期事业单位财务管理新问题与新对策

近年来,随着我国经济迅速发展,各行各业呈现出繁荣的景象,这样的发展状况使得我国事业单位在实现自身发展的同时,也遇到了各种各样的财务新状况,事业单位也对单位财务管理内

期刊

事业单位财务管理对策

p27～（kip1）、MMP-9和α-Catenin在皮肤鳞状细胞癌中的表达及意义

背景鳞状细胞癌是皮肤常见恶性肿瘤之一，近年来其发病率逐渐升高。为了进一步提高皮肤鳞状细胞癌的诊疗水平，需对该病进行遗传学、病理学、细胞分子生物学的研究。研究表明

学位

皮肤肿瘤鳞状细胞癌免疫组化p27kip1MMP-9α-Catenin

基于差分隐私的精确直方图发布算法的设计与实现

与本文相关的学术论文