基于差分隐私的精确直方图发布算法的设计与实现

来源 :贵州大学 | 被引量 : 0次 | 上传用户:yufs80131234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
直方图是数字数据分布的精确图形表示,广泛用于数据发布、数据挖掘和分析。然而,如果我们直接使用原始数据来发布直方图,这似乎存在隐私漏洞。差分隐私(DP)作为一种数学定义,是在数据库中发布汇总数据统计查询的理想解决方案,能够抵御任意背景知识的攻击者并提供了强大的隐私保护保障。本文研究了基于差分隐私的精确直方图发布算法。本文的主要目的是通过确保发布算法满足差分隐私的同时,提高发布直方图的精度。本文首先分析了V-优化直方图变体算法——噪声优先算法(NoiseFirst)和结构优先算法(StructureFirst)。然后通过复原算法并实验,对其进行了深入研究,并指出了这些算法中存在的问题和不足。为了解决这些问题,本文提出了如下优化及解决方法。其次,本文提出了一种优化结构下的算法(Optimization Structure Algorithm,OSA)。该算法首先通过近似最优的解决方案将隐私预算分成两部分,然后执行迭代的动态规划(Dynamic Programming)算法来获得最优的分组结构,因此新生成的直方图拥有最小的分组误差。然后,通过使用优化的指数机制来保护最优结构的隐私,并计算每个分组的均值。最后,为每个分组的均值添加拉普拉斯噪声并发布最优的直方图。在真实的数据集上,OSA与现有的算法Boost进行实验比对,通过实验结果表明,OSA超越了Boost算法,并达到了更好的效用。再次,本文设计了一种新的直方图发布机制(Optimal Mechanism,OM),可以在满足差分隐私的同时发布更准确的直方图。首先,本文采用随机快速排序算法(Randomized quicksort Algorithm,RA)对注入拉普拉斯噪声的直方图进行排序,以便降低误差。RA法能够有效抵抗已知排序算法并利用特定数据进行恶意攻击的敌手。这也是本文使用该算法的原因。此外,在分组问题上,本文提出并设计了基于动态规划思想的最小误差权重的解决方案(Dynamic Programming based on Error Weights,DPEW),以进一步提高所发布的直方图的准确性。最后,本文使用两个真实数据集提供详细的实验评估分析,其数据范围从数千到数百万条记录不等。这些数据集来自互联网上的各种领域(例如,巴西的IPUMS人口普查,希拉里克林顿和唐纳德特朗普的推文)。本文的结果给出了算法实验数据比对,并证实了本论文设计实现的机制优于其他同类方法,验证了算法将产生更小的误差,并大大提高了直方图上范围查询的准确性。
其他文献
目的 研究丙戊酸(VPA)对人卵巢癌A2780细胞生长及血管生成和转移相关因子(VEGF、MMP-9、MMP-2、E-cadherin)表达的影响。 方法 用不同浓度(0、1、2、3、4、5mmol/L)的VPA处
本文从生产方式、思想意识、文学艺术、风俗习惯、政治制度、文化教育等方面阐述了高句丽文化中的汉文化因素。通过高句丽民族在不同时期、不同侧面对汉文化承袭的诸多特征,
塔式起重机是目前建筑工地中常用的施工设备,由于工作环境复杂,极易发生碰撞事故,一旦发生事故往往会造成严重的经济损失和人员伤亡。如何避免施工过程中塔机之间以及塔机与
血管内皮生长因子受体-2(Vascular endothelial growth factor receptor-2/kinase-insert domain containing receptor:VEGFR-2/KDR)广泛分布于血管内皮细胞,也分布于部分肿瘤细
鄂尔多斯盆地上古生界盒8段气藏属典型的低孔低渗的砂岩岩性气藏,受沉积环境的影响,盒8段储层在盆地中较为发育,但储层段物性及含气性在横向上存在着严重的非均质性[1].因此,
为确定限制性饮食者的注意偏向、情感评定与进食行为之间的关系,本研究通过三个实验分别考察限制性饮食者注意偏向、情感评定及进食行为的特点,并综合分析三者之间的关系。使
<正>宁波市镇海区人民医院于2012年3月开始实行对拟行内镜下逆行性胰胆管造影术(ERCP)手术的患者进行手术前探访、宣教及术中、术后护理干预,结果显示这对解除患者术前紧张情
野生大麦(Hordeum spontaneum)作为栽培大麦(Hordeum vulgare)的祖先,有着极强的生态适应能力,可在高纬度,高海拔,恶劣气候,贫瘠土壤等环境中生存。野生大麦具有广泛的遗传基
近年来,随着我国经济迅速发展,各行各业呈现出繁荣的景象,这样的发展状况使得我国事业单位在实现 自身发展的同时,也遇到了各种各样的财务新状况,事业单位也对单位财务管理内
背景 鳞状细胞癌是皮肤常见恶性肿瘤之一,近年来其发病率逐渐升高。为了进一步提高皮肤鳞状细胞癌的诊疗水平,需对该病进行遗传学、病理学、细胞分子生物学的研究。研究表明