面向拉普拉斯机制的差分隐私保护聚类方法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:noonbird
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能行业的飞速发展,数据挖掘技术作为人工智能的一个重要分支,在社会中得到了广泛应用,聚类分析作为数据挖掘领域中重要的算法,在各行各业扮演着重要的角色。然而利用聚类算法在挖掘数据潜在关联的同时,也可能造成用户的隐私泄露。因此,在利用聚类算法进行数据挖掘时,对隐私信息进行保护具有重要的意义。作为一种隐私保护方法,差分隐私定义了一种极其严格的攻击模型,将其应用于聚类分析过程中进行隐私保护,通过向数据加入拉普拉斯噪声在保证数据可用性的前提下对数据隐私进行了保护。针对基于差分隐私保护的聚类算法在数据可用性较低和隐私性不足的问题,本文做了如下工作:(1)针对k-means聚类算法在初始中心点盲目随机选择和对异常值敏感两方面的问题,提出了基于异常点检测与初始中心点选择优化的k-means聚类方法(OPT k-means)。该方法在检测异常点时利用本文提出的箱型隔离森林算法(IFAB),在选择初始中心点时利用质心距离最远的思想,结合决策距离与决策集合提出了初始中心点选择算法(IPS),在聚类过程中减少了异常值干扰,并使初始中心点尽可能地分布在不同的簇中的同时向簇中心靠拢。实验表明,该方法在提高聚类效果的同时有着较大的时间优势。(2)针对聚类分析过程中隐私泄露问题,为了实现差分隐私保护,提出了基于差分隐私保护的OPT k-means算法(OPTDP k-means)。该算法在对初始中心点加噪时利用本文提出的初始中心点加噪算法(DP-IPS),实现过程中对样本点加入拉普拉斯噪声降低了聚类分析过程中隐私泄露的风险,保证了隐私安全。实验表明,该算法在保护隐私不被泄露的前提下,更好地保证了数据的可用性,同时提高了算法的运行效率。(3)针对传统DP-DBSCAN算法安全性不足问题,提出了基于加噪方式改进的DP-DBSCAN算法(IDP-DBSCAN)。该算法对传统DP-DBSCAN算法加噪方式进行改进,对核心对象加入拉普拉斯噪声,更大程度上地降低了隐私泄露的风险。实验表明,该算法在很大程度上保留了传统DP-DBSCAN算法数据可用性的前提下,有较高的安全性。(4)针对传统CURE算法选择代表点时计算量大和异常点检测具有主观性等多方面问题,提出了基于决策距离改进的CURE算法(I-CURE)。该算法利用决策距离和决策集合检测异常点并选择代表点,利用异常点重分配算法(OLRB)重新划分异常点。为了解决CURE聚类算法和I-CURE聚类算法在聚类分析过程中的隐私泄露问题,提出了基于差分隐私保护的CURE算法(DP-CURE)和基于差分隐私保护的I-CURE算法(DP-I-CURE)。实验表明,I-CURE算法在时间效率和聚类准确性方面有较好的效果,DP-CURE算法和DP-I-CURE算法在满足安全性的同时,保证了数据的可用性。
其他文献
目的:本实验初步研究了Cr(Ⅵ)对果蝇S2细胞增殖的影响及其凋亡机制,为Cr(Ⅵ)诱导细胞凋亡机制的深入研究提供了部分实验依据,期待为后期研究Cr(Ⅵ)诱导人类细胞凋亡机制提供理
随着信息技术的迅速发展,一些NP完全问题不仅仅是一个理论问题,而逐渐成为一个具有广泛应用的实际问题。多数学者认为图的非同构问题是一个NP完全问题,其中无向树是图论中的一个
随着2015年新的一轮电力改革的拉开序幕,电力市场走向开放成为不可逆的趋势。本次电力改革的基本原则是“管住中间,放开两头”,即管住电力的输、调、配环节,将电力的生产和消
目的:本研究通过检测患者血清脂蛋白相关磷脂酶A2(Lp-PLA2)、髓过氧化物酶(MPO)、超敏C-反应蛋白(hs-CRP)水平,结合冠状动脉造影(CAG)及血管内超声(IVUS)检查,探讨Lp-PLA2、MPO、hs-CRP与冠状动脉易损斑块的相关性,及对急性冠脉综合征(ACS)的早期预测价值。方法:(1)分组:采取连续入组的方式,入选2018年10月至2019年08月期间于河北北方学院附属第一
目前,我们了解的宇宙知识很大一部分来自于对天体光谱的研究,要想准确的分析出天体光谱信息,就需对各种元素对应的光谱进行测量分析。将分析的数据应用到观测的天体光谱中就可以
在国家自然科学基金项目“模拟月表的二向性反射及其光谱混合机理研究”支持下,旨在建立考虑地形影响的反射率升尺度转换方法,基于多元回归分析模型反演15km分辨率月壤中FeO含
谷胱甘肽(GSH)是广泛存在于各种生物体中的活性三肽,具有抗氧化、解毒、转运氨基酸和保护细胞等重要的生理功能,目前,已广泛应用于食品和临床等方面。γ-谷氨酰半胱氨酸合成
随着光电子学、纳米技术的飞速发展,集成光学对集成系统密度的要求逐渐提高。表面等离子体激元波导可以最大限度地把电磁场约束在金属与介质分界面处,在高速率数据传输的光子
电磁超材料是近年来基于电磁学的一个重大发现。它因具有独特的电磁特性和潜在的发展前景,成为科学和工程领域里的研究热点。本文主要研究了基于超材料的回音壁模和平板复合
液体材料具有良好的非线性效应和非机械性能,在液芯光纤和光流体等光电器件中得到了广泛的应用。咪唑类离子液体作为一类新型的环保液体媒质,可以通过选择或改变离子液体的阴