支持差分隐私保护的HADPK-means++聚类算法研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:h462r5134dg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,各种电子设备所产生的海量数据中蕴含着巨大的价值信息,例如医疗机构的患者诊断信息,银行机构的客户信息等。聚类分析作为一种典型的无监督数据挖掘方法,可以从海量数据中挖掘未知知识和潜在价值。然而在挖掘有用信息的同时,可能会泄漏数据中的个人隐私信息,为此隐私保护技术应运而生。差分隐私作为一种新型而且严格数学证明的数据失真技术,因无需关注攻击者所拥有的背景知识,近年来得到广泛研究。将差分隐私噪声引入到聚类分析过程中,可以很好地保护敏感数据,防止隐私泄露,然而噪声扰动会导致聚类结果可用性的降低。因此,如何在保护敏感数据的同时,提高聚类算法的可用性,是目前尚需解决的问题。差分隐私k-means聚类算法通过在每轮迭代中发布簇中心的估计值来满足差分隐私,有效避免了隐私泄露。然而,扰动簇中心会带来随机性误差,从而偏离真实簇中心,导致最终聚类效果较差。针对此问题,本文提出支持差分隐私保护的HADPK-means++聚类算法(A Highly Available Differential Privacy Kmeans++Clustering Algorithm,HADPK-means++)。首先,对于初始中心选择的敏感问题,提出一种基于逆序排序的初始中心选择算法,使得初始中心选择更加的稳定和准确。其次,对于噪声扰动带来的随机误差影响,提出一种基于簇内和簇间相似度的相似度度量方法,使得划分簇更加的准确。最后,基于差分隐私的变换不变性,提出一种解决簇中心偏离问题的簇中心修正机制,防止所有样本被划分到同一个簇中的极端情况。对比实验表明,本文所提算法的聚类可用性在同等隐私保护水平下高于现有的差分隐私k-means聚类算法。推荐系统根据用户行为数据进行个性化推荐,然而在海量用户下,不仅搜索最近邻的时间过长,而且使用数据可能会泄露用户隐私信息。针对此问题,本文将HADPK-means++算法应用于协同过滤推荐中。首先对评分矩阵执行HADPKmeans++算法,保护用户隐私,然后在同一个簇中寻找最近邻,缩小查找范围,最后产生预测评分并进行推荐。实验结果表明,基于HADPK-means++的协同过滤推荐能够实现推荐准确性和隐私性之间的平衡,同时也说明本文HADPKmeans++聚类算法也可应用于其他数据挖掘案例中来保护用户隐私信息。
其他文献
学位
随着集成电路的大规模发展,晶体管的集成度越来越高,以电子为载体的芯片受延时、功耗、散热等问题的影响,使摩尔定律遭遇瓶颈。将光子引入芯片中,实现光子与电子的相互作用,是进行高速信息传输与处理的最好方案,特别是将微电子器件和光子器件共同集成到硅材料平台。硅基光源作为光互连系统中的重要组成部分,常以混合集成的方式嵌入到各大光学模块中,激光器的尺寸相对较大,难以实现大规模集成。单片集成光源则被认为是片上光
目的微囊藻毒素-LR(microcystin-LR,MC-LR)是一种具有促肿瘤活性的蓝藻毒素,环境中蓝藻毒素暴露可能是精原细胞瘤的发生的重要诱因。本研究旨在探讨MC-LR对精原细胞恶性转化的影响,并揭示PI3K/AKT/m TOR通路在MC-LR诱导小鼠精原细胞恶性转化中的调控作用及其机制,为精原细胞瘤的发生提供病因线索。方法1.MC-LR染毒浓度和染毒方式的确定通过CCK8试剂盒联合酶标仪检测
研究目的比较内镜下密集套扎术和内镜下组织胶栓塞术预防肝硬化胃静脉曲张再出血的效果,探讨最佳的二级预防方案。方法采用回顾性队列研究方法,选取2018年1月至2020年1月就诊于河南省人民医院的88例食管胃静脉曲张患者,根据胃静脉曲张二级预防方式分为内镜下密集套扎术组(EVL组)和内镜下组织胶栓塞术组(EVO组),收集两组患者的相关资料,临床相关资料包括年龄、性别、血清白蛋白、血清胆红素、凝血酶原时间
红枣缺陷检测是红枣深精加工过程中的一个重要环节。随着近代机器视觉和自动控制领域的快速发展,已经基本摆脱人工性质的红枣检测体系,基于机器视觉与自动控制的自动化检测系统已经愈发成熟。但目前所采用的红枣缺陷检测设备及技术仍存在体积大、效率低、分类算法不完善等缺点。本文基于机器视觉及模式识别理论对红枣全表面缺陷检测中的关键技术进行了深入的研究,主要研究内容如下:针对红枣外部缺陷,确定了红枣全表面缺陷检测平
背景急性肾损伤(acute kidney injury,AKI)是由多种病因和机制引起的以肾功能迅速下降为特征的临床综合征。其中脓毒血症是临床中最常见的急性肾损伤病因之一。约有47.9%的病人诊断为脓毒血症伴有急性肾损伤,且患病率呈增加态势,并且脓毒血症伴有急性肾损伤(septic acute kidney injury,SA-AKI)患者其病死率超过单纯患有脓毒血症的患者。目前临床诊断SA-AK
学位
学位
学位
学位