基于多分类混合型数据的匿名保护技术研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cherry_20050901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网和信息技术的迅猛发展使累积的数据爆发式增长,人们通过数据挖掘等技术对发布的数据进行整理、分析,进而获取有用的信息,这为人们带来利益的同时也导致了用户隐私的泄露。作为隐私保护最常用的主要技术之一,基于聚类的匿名化技术通过对相似数据进行聚类、泛化等处理,满足了对用户敏感信息保护的基本要求。但该算法过分依赖聚类中心的随机选取,并且未考虑敏感属性的多元约束,这不仅会暴露隐私信息还会造成更多的数据信息损失。因此,为了在有效保护用户隐私安全的情况下减小发布数据的信息损失,本文对基于聚类的匿名化方法进行了改进研究:(1)本文针对传统的基于聚类的k-匿名算法随机选取聚类中心点造成聚类结果不准确,从而导致数据信息损失较大的问题,提出一种优化聚类中心选取的改进算法。该算法在密度峰值(Density peak clustering,DPC)算法的基础上,结合M-近邻(M-Nearest Neighbor,MNN)思想按照数据相似度将数据集划分为多个簇,在每个簇中找到覆盖范围最大的数据点作为初始中心点,减小了聚类中心不确定性对聚类结果的影响。通过选取准确的聚类中心对数据划分,减少了算法执行的迭代次数,获得更准确的聚类结果,使得泛化后的数据信息损失更小。论文从算法运行时间和数据信息损失方面对改进算法进行仿真,仿真结果验证了该算法减小了数据信息的损耗,提高了发布数据对外界的可用性。(2)对于匿名化处理后的数据敏感属性值相同、分布频率差异大以及数值相似性高造成的隐私泄露问题,本文设计出一种基于(k,l,α)约束的匿名算法。该算法首先根据敏感属性值的相似度对数据分类,在聚类过程中对等价类中敏感属性值的种类、分布频率进行约束,在信息损失最小的原则下将数据集划分为多个满足敏感属性值约束的等价类。为提高聚类精度,将混合型数据细分为数值型,无序分类型和有序分类型三种类型数据,重新确定出不同类型数据之间的距离公式,提高数据划分的准确性,减小数据的信息损失。论文最后从算法运行时间,隐私保护性能和数据信息损失三方面对改进算法进行仿真,结果验证了该算法在敏感属性的多元约束下能同时抵御相似性攻击和偏斜性攻击,在提高用户隐私保护有效性的同时增加了数据信息对外界的可用性。
其他文献
深度学习因其为非结构化数据提供了强大的自动特征提取和表征能力,从而在计算机视觉、自然语言处理、机器人技术等人工智能领域展现了优异的性能。针对不同的实际应用场景,人工设计出了许多高性能神经网络结构,但手工设计网络结构往往需要丰富的目标领域专业知识与极高的人工成本。为了解决这一问题,自动化设计神经网络结构受到了学术界和工业界的广泛关注。神经网络架构搜索(Neural Architecture Sear
学位
随着信息技术的飞速发展,数据呈现出多视图的特点,尤其是单视图数据不能全面描述所有实例的信息。因此综合利用多个视图来全面和准确地表示数据是很重要的。多视图学习已经成为计算机视觉、人工智能等领域广泛研讨的热门话题。作为多视图学习的一个主要的研究范畴,多视图聚类在最近十几年里得到了迅速的发展,而且取得了巨大的技术提升,也因此得到了人们普遍的重视。其中,基于子空间的聚类试图在低维特征空间中搜索数据的最优聚
学位
随着近些年空间探索技术的蓬勃发展,太空中不同种类卫星的数量持续增加,由此带来的空间信息数量也迎来了爆发式的增长,为空间目标监视、态势感知等领域的发展带来了巨大压力。另一方面,人工智能技术也在近些年飞速发展、趋于成熟,以图像检测识别、信息检索为代表的深度学习方法为空间信息技术的进一步发展带来了曙光。如何使用这些图像数据对重点空间目标进行分类、检测是最近的研究热点。然而,使用深度学习对空间探索技术赋能
学位
与传统的全色和多光谱遥感图像相比,高光谱遥感图像一般由数十个乃至几百个从可见光到远红外的波段组成,包含了更加丰富的空间信息和光谱信息。这一特点使得高光谱遥感图像解译在各种对地探测任务中发挥着非常重要的作用。近年来深度学习在高光谱遥感图像解译中取得了很大的进展,然而高光谱遥感图像中标记样本的缺乏也严重制约了依赖于大数据驱动的深度学习模型。因此,在小样本条件下讨论并研究相应的高光谱图像解译的深度学习方
学位
智能医疗系统为人们提供健康服务,该系统使得医生与患者之间可以不受地域限制地进行交流并为患者提供医疗帮助。智能医疗系统包括附着在人体上的可穿戴设备与传感器,这些设备与传感器使用全球定位系统(GPS)向医疗服务提供者不断发送患者的位置以及时间戳信息,这些信息在发送给医疗服务提供者时可能会导致患者位置及敏感信息的泄露,因此必须得到保护。本文使用两种基于边缘服务器的方法来保护患者的位置隐私,我们使用机器学
学位
图学习相关的深度学习技术在近些年得到了快速的发展,图神经网络的出现更是为图数据的诸多应用场景下的任务提供了极具竞争力的方案。然而,攻击者通过在原始图数据上添加一些难以察觉的轻微扰动所生成的对抗样本,会导致图神经网络模型产生有误差的学习结果。这将威胁到公共安全和个人隐私,不能满足一些应用场景下的系统安全性需求。因此,对图神经网络的安全性研究是十分必要的,能够推动图神经网络技术在实际生活中的应用的发展
学位
秘密共享经过40多年的研究发展,在密码学占据重要地位。作为一种有别于传统密码学技术,除了可以保护数据,它还可以提高数据的鲁棒性。因此被广泛应用于通信密钥管理、安全协议、网络数据安全、导弹控制发射等方面。本文提出针对不同应用场景下的两种秘密共享方案,实现了对图像的渐进恢复效果。第一种方案是基于随机网格的图像秘密共享技术,该方案可以应用在计算资源稀缺的场景。针对视觉秘密共享方案恢复效果差的问题,通过减
学位
目标检测技术的主要任务是寻找图片中人们所感兴趣的目标,并判断它的类型和位置,是机器视觉领域的一项关键技术。近年来,基于神经网络的目标检测算法在人脸识别、行人检测和智能交通系统等领域都有着广泛地应用。随着集成电路和深度学习技术的发展,面对各种高分辨率和高帧率的应用场合,为了进一步提高算法检测的性能,使用的网络层数变得越来越多,计算量和参数规模变得更加庞大,无法满足小体积、低功耗的嵌入式应用。因此,本
学位
决策树分类是一类被广泛应用的机器学习方法,由于其直观性强和分类性能高效等特点,目前已经在移动通信、智慧医疗诊断等方面得到广泛应用,并在物联网大数据领域中具有广阔前景。在现实场景中,分类服务提供过程涉及用户隐私数据以及服务提供商所持有的决策树模型中的树形结构数据之间的交互计算,从而会带来一系列的隐私泄露问题。因此在实际部署中迫切需要针对决策树分类模型提供专用的隐私保护方法。为此,本文将面向物联网大数
学位
图像修复是指恢复不完整图像中受损部分的像素特征,是计算机视觉领域研究的一项经典问题,如今在图像编辑、面部修复、虚拟现实及数字文化遗产保护等领域依然具有广泛的应用价值。在图像修复问题中,传统方法主要通过对缺失空洞周边信息的扩散,或者搜索相似补丁进行匹配的方式完成修复,当缺失空洞过大时并不能准确的恢复其中的信息。近年来,随着人工智能科学研究和深度学习相关技术的实施,基于深度学习的图像修复技术成为了计算
学位